学术
ICML2025|多模态理解与生成最新进展:港科联合SnapResearch发布ThinkDiff,为扩散模型装上大脑
多模态理解与生成新方法ThinkDiff在ICML2025上提出,仅需少量数据和计算资源,让扩散模型具备推理能力,并通过视觉-语言训练和掩码策略传递VLM的多模态推理能力,大幅提高图像生成质量。
两周反转:Anthropic「闪电」夺回被Cursor挖走的核心编程大将
Anthropic 重新聘回 Claude Code 的关键负责人,导致公司估值冲到 1000 亿美元。Claude Code 成为 Anthropic 的拳头产品,贡献了超过 2 亿美元的年化收入。
普林斯顿团队领衔发布最强开源数学定理证明模型:32B性能大幅超越前代SOTA DeepSeek 671B
普林斯顿大学联合多所顶尖机构推出Goedel-Prover-V2模型,实现形式化数学推理的新突破。该模型在MiniF2测试集上性能超越DeepSeek-Prover-671B和Kimina-Prover-72B。
ICML 2025 CostFilter-AD首提“匹配代价滤波”范式,无监督异常检测指标全面刷新
萨里大学合作完成,通讯作者为吴高昌副教授(东北大学)与朱霞天副教授(萨里大学)。
论文标题:
Cos
面对无解问题大模型竟会崩溃?港中文&华为联合提出首个大模型推理可靠性评估基准
本文提出首个大模型推理任务可靠性基准ReliableMath,揭示现有模型在处理无法解问题时的缺陷,并设计了用于评估可靠性的方法和数据集。通过实验分析发现,使用指令性提示可以显著提高模型对不可解问题的回答准确性及可靠性,但小模型仍存在提升空间。
一张图,穿梭任何场景!AniCrafter开源登场,让角色动画真正做到“无缝生成”
AniCrafter 通过引入3DGS Avatar + 背景视频作为条件控制视频扩散模型,实现任意角色在任意场景下的动画化任务。项目和代码链接已提供。