大模型归档 - 第24页共147页

MiniMax-M1开源，Kimi深度研究内测，GPT-5今夏发布，Gemini稳定上线！ AI Weekly 6.16-22

2025年6月22日14时作者 AI信息Gap

ax-M1
发布，MoE 架构，总参数 4560 亿，支持百万 tokens 上下文，是
DeepS

让爱因斯坦和赫本说相声

2025年6月22日11时作者路过银河AI

腾讯开源声音驱动画面模型HunyuanVideo-Avatar，能生成动态、情感可控和多角色对话视频，有望颠覆短视频直播行业。

代码类型的RAG做chunk切分怎么做？兼看改进AST方案

2025年6月21日19时作者老刘说NLP

2025年6月21日，北京晴。代码RAG的切分方法包括基于语法结构和逻辑块的切分策略，以及混合策略。前者破坏语义完整性，后者在保留功能性和连贯性方面表现不佳。改进方案cAST使用抽象语法树进行递归分割，结合贪婪合并以提高信息密度，并通过非空白字符数量来衡量块大小。

【Agent专题】开局篇：Agent的崛起！Agent的核心技术栈解密！Agent看见智能未来！

2025年6月21日14时作者 AI技术研习社

2025年AI Agent元年来临，大模型进化成能‘干活’的智能体。Agent具备感知环境、理解目标、拆解任务、调用工具等能力，从被动等待指令到主动规划执行并学习反馈。

大模型才是智能体的核心，智能体的所有操作都是基于大模型完成的——智能体的执行过程

2025年6月21日14时作者 AI探索时代

开发智能体的关键是大模型、Prompt和工具三者结合。Prompt引导模型理解和执行特定任务，工具提供具体操作手段。智能体的核心流程包括需求理解、工具选择与使用、结果分析及问题解决。

谷歌 Gemini 2.5 技术白皮书来了：顶级推理、百万上下文、多模态理解

2025年6月21日14时作者 AI信息Gap

谷歌发布Gemini 2.5系列模型，包含Pro、Flash和Flash-Lite三个版本。Pro版支持多模态输入、超长上下文处理能力；Flash版优化推理速度与成本效率；Flash-Lite版主打极低延迟和高性价比。Gemini 2.5 Pro采用稀疏激活MoE架构、大规模TPU v5p训练及强化学习控制的思维路径，显著提升性能与效率。测试显示其在编程、数学等领域能力全面提升，并具备多模态任务合成与创作输出的能力。