问题解决归档 - 每时AI

月之暗面「调教」出最强Agent，在「人类最后一场考试」拿下最新 SOTA

2025年6月21日16时作者机器之心

er 的自主 Agent。
这款 Agent 擅长多轮搜索和推理，平均每项任务执行 23 个推理步骤

关于Agent在实际开发过程中遇到的问题记录

2025年5月31日14时作者 AI探索时代

文章讨论了在实际操作中基于Agent的复杂性，以及如何通过拆分和优化多个Agent来改进数据分析功能。

太猛了！DeepSeek R1核心技术复现，30美元实现：小模型 RL Scaling 革命

2025年1月26日16时作者 AI寒武纪

来自加州伯克利大学的研究团队以极低的成本（低于30美元）成功复现了DeepSeek R1-Zero的关键技术，并在‘倒计时’游戏中展示了小型语言模型的强大自验证和搜索能力。

27亿刀天价员工首个成果，谷歌版o1算出最难高考数学题！物理代码难题闪电秒解

2024年12月20日18时作者新智元

谷歌发布的Gemini 2.0 Flash Thinking模型在多个领域表现卓越，能够解决复杂数学、物理等问题，并清晰展示思考过程。该模型在Chatbot Arena中横扫所有类别，成为最强的理科生。