大模型归档 - 第8页共58页

DeepSeek-R2！？神秘模型惊现竞技场，真实身份引网友猜测

2025年7月3日16时作者量子位

DeepSeek发布的新模型steve引发猜测，有人认为它可能是R2。steve被确认来自DeepSeek，但表现未达到预期。R2的研发也经历了多次延期。

2025年7月2日23时作者钛媒体AGI

国产AI大模型‘六小虎’之一的智谱宣布获得浦东创投集团和张江集团10亿元的战略投资，并启动与上海仪电、浦发集团的合作。智谱还发布并开源新一代通用视觉语言模型GLM-4.1V-Thinking及MaaS全新上线Agent聚合平台，展示其在模型更新方面的进展。

2025年7月2日16时作者 AI前线

伯格近期的一系列动作引发了轩然大波，其大力招募 AI 人才的举措，直接触动了行业巨头 OpenAI

2025年7月1日16时作者量子位

一篇关于博主通过威胁猫猫命运成功治理AI胡编乱造参考文献问题的文章，获得了大量点赞和评论。然而，使用这种方法测试DeepSeek发现其表现并不理想，依然存在错误的文献链接。文章探讨了如何降低人工智能生成内容中的幻觉现象。

2025年7月1日16时作者量子位

华为开源Omni-Infer项目，提供超大规模MoE模型推理的框架和加速套件。支持昇腾硬件平台上的大模型推理，并实现PD分离自动化部署，简化使用环境与安装流程。

2025年7月1日14时作者老刘说NLP

老刘说NLP技术社区致力于通过早报、专题分享和线上活动等方式，围绕大模型、RAG、文档智能及知识图谱等主题进行技术交流。目前已有43次线上分享和技术专题文章，并提供会员制服务，吸引了众多成员参与。

2025年7月1日14时作者 IT桔子

极客公园
封面 | 公众号AI生成
过去一年，大模型的世界几乎是「狂飙」的同义词。技术以周为单位迭代

2025年7月1日14时作者 AI探索时代

ReAct Agent基于思考-行动-观察的智能体，核心是通过提示词操作大模型完成任务。多种提示词范式如ICL、CoT、Self-Consistency等通过不同方式注入信息以优化模型能力。