超越Claude 3.5和o1!8B模型靠「分层投票+测试时训练」逆袭
MIT研究者发现,测试时训练方法能帮助大模型提升复杂推理问题的准确率。该方法将单个未标记的测试实例转化为自监督学习问题,在对测试样本进行预测之前更新模型参数。
MIT研究者发现,测试时训练方法能帮助大模型提升复杂推理问题的准确率。该方法将单个未标记的测试实例转化为自监督学习问题,在对测试样本进行预测之前更新模型参数。
Windsurf被谷歌和Cognition分别收购一部分,创始人跑路。此事件引起硅谷VC大佬不满,认为该模式将对初创公司生态系统造成负面影响。
谷歌 DeepMind 新一代 Gemini 模型在 IMO 竞赛中解决五道高难度数学题,获得 35 分满分 42 分的金牌成绩,并证明 AI 可以通过自然语言理解攻克复杂难题。
2025年7月22日,北京晴。文章介绍了《DeepWriter》的工作思路和设计方法,包括分层知识表示、结构化写作流程、多模态内容融合以及细粒度引用等关键点,并详细讨论了离线知识库构建与在线写作流程中的核心技术。
Zread 是一个 AI 工具,帮助用户快速理解复杂代码库。它通过生成仓库指南和趋势功能提供即时访问项目文档,并支持教育、协作和面试等应用场景。此外,它还有 Github 趋势分析功能,让用户了解最火项目的背后故事。这使用户能够更好地理解和学习开源项目背后的团队和技术演进过程。