深度学习归档 - 第2页共21页 - 每时AI

首个开源「AI智能语音转文本模型」，质量超whisper，成本爆降。

2025年7月21日23时作者开源AI项目落地

Voxtral 是由 Mistral AI 开源的首个语音智能模型系列，包含 24B 参数和 3B 参数的 Voxtral Small 和 Voxtral Mini。它支持长音频转录、语义理解以及多语言处理，并能根据语音触发 API 或生成摘要。成本不到同类闭源方案的一半，适用于企业生产环境部署。

ICML 2025 Transformer还有救？魔改残差连接，MUDDFormer硬刚超深网络

2025年7月21日16时作者 PaperWeekly

不太可能了。
但是总有人愿意打破常规，最近一篇 ICML 2025 的论文，又让 Transform

谷歌AlphaFold得了诺奖，但DeepMind根本没引用前人论文？

2025年7月20日16时作者新智元

AlphaFold因获得诺奖而声名大噪，但其原型早在2016年就已提出。Vladimir Golkov在NeurIPS上发表的研究揭示了利用深度神经网络预测蛋白质接触图的方法。AI学术大佬如Yann LeCun和Pierre Baldi指出，在DeepMind之前已有使用深度学习进行类似工作的研究，强调科学探索的传承与发展的重要性。

真实物理加持，人物动画再也不像塑料人！UIUC华人让角色活起来了 ICCV’25

2025年7月19日16时作者新智元

PhysRig是UIUC与Stability AI联合提出的一种新的角色动画技术，通过引入可微分物理模拟替代传统LBS方法，显著提升了角色动画的真实感，解决了体积丢失和变形伪影问题。

OpenAI 史上最惨发布：ChatGPT Agent 遭暴击，国产 AI 轮番「公开处刑」

2025年7月19日12时作者 APPSO

200 刀的 Pro 用户没那么多），而是各家 Agent 竞品。
Manus 发布多则推文与 Ch

首篇潜空间推理综述！模型思考不必依赖Token，带宽暴增2700+倍

2025年7月16日16时作者量子位

式）
思维链
（CoT）
的2700多倍
？
史上首篇潜空间推理综述，对这种新兴的推理范式进行了全面

一篇被证明“理论有误”的论文，拿下了ICML2025时间检验奖

2025年7月15日23时作者量子位

2015年发表的Batch Normalization论文在ICML 2025会议上荣获时间检验奖。这篇开创性工作极大地推动了深层神经网络的训练和应用，是深度学习发展史上的里程碑。

飞书跑通AI商业化的秘密：用得深，才是真护城河

2025年7月10日23时作者乌鸦智能说

理要点，如今，它正成为AI竞逐的新高地。一批“AI会议笔记”类产品在硅谷迅速崛起，成为投资人争抢的核