学术归档 - 第16页共283页

昨晚，云计算一哥打造了一套Agent落地的「金铲子」

2025年7月17日23时作者机器之心

ok 4、Kimi K2 的发布，利用多智能体技术，这些大模型可以自主理解所在任务环境，决定行动的方

多模态理解与生成新方法ThinkDiff在ICML2025上提出，仅需少量数据和计算资源，让扩散模型具备推理能力，并通过视觉-语言训练和掩码策略传递VLM的多模态推理能力，大幅提高图像生成质量。

2025年7月17日16时作者机器之心

Anthropic 重新聘回 Claude Code 的关键负责人，导致公司估值冲到 1000 亿美元。Claude Code 成为 Anthropic 的拳头产品，贡献了超过 2 亿美元的年化收入。

2025年7月17日16时作者机器之心

普林斯顿大学联合多所顶尖机构推出Goedel-Prover-V2模型，实现形式化数学推理的新突破。该模型在MiniF2测试集上性能超越DeepSeek-Prover-671B和Kimina-Prover-72B。

2025年7月17日16时作者机器之心

挑战。随着模型参数规模扩大至数千亿级别，训练和推理的成本变得高昂，阻碍了其在许多实际应用中的推广与落

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

2025年7月17日12时作者 HyperAI超神经

rAI超神经主办的第 7 期 Meet AI Compiler 技术沙龙活动上，沐曦集成电路的高级总

2025年7月16日23时作者 PaperWeekly

萨里大学合作完成，通讯作者为吴高昌副教授（东北大学）与朱霞天副教授（萨里大学）。
论文标题：
Cos

2025年7月16日23时作者机器之心

本文提出首个大模型推理任务可靠性基准ReliableMath，揭示现有模型在处理无法解问题时的缺陷，并设计了用于评估可靠性的方法和数据集。通过实验分析发现，使用指令性提示可以显著提高模型对不可解问题的回答准确性及可靠性，但小模型仍存在提升空间。

2025年7月16日23时作者 PaperWeekly

AniCrafter 通过引入3DGS Avatar + 背景视频作为条件控制视频扩散模型，实现任意角色在任意场景下的动画化任务。项目和代码链接已提供。