2025年5月6日16时 - 第5页共10页

超越DeepSeek-R1，英伟达开源新王登顶！14万H100小时训练细节全曝光

2025年5月6日16时作者新智元

新王Llama-Nemotron，是怎么训练出来的？刚刚放出的论文，把一切细节毫无保留地全部揭秘了！

2025年5月6日16时作者机器之心

近日，ICML 2025 新研究揭示大型语言模型中注意力机制的查询 (Q) 和键 (K) 表示存在极大值现象，而值 (V) 表示则没有这种模式。极大值对上下文理解至关重要，研究提出保护 Q 和 K 中的大值能有效维持模型的上下文理解能力。

2025年5月6日16时作者 PaperWeekly

慢思考）。但在日常的使用中，大量用户提问的问题更多是系统 1 问题（这些问题可以直觉快速回答），他们

2025年5月6日16时作者智东西

penAI宣布更新的公司组织架构重组计划，继续由非营利组织监督和控制。
OpenAI的营利性有限责任

2025年5月6日16时作者机器之心

成功能爆火，掀起了以吉卜力风为代表的广泛讨论，生成式 AI 的热潮再次席卷网络。
而在这股浪潮背后，

2025年5月6日16时作者新智元

AI首次非侵入性读取被火山灰封存2000年的古卷，揭示了《论恶习》第一卷标题。维苏威挑战赛获奖者获得6万美元奖金，展示了AI在考古中的巨大潜力。

2025年5月6日16时作者智东西

OpenAI宣布以约30亿美元收购AI编程创企WindSurf，后者估值同比增长140%至30亿美元，拥有超100万用户和1000多家企业客户。

2025年5月6日16时作者 PaperWeekly

文字生成图片、视频（生成任务）。
自回归模型（就是那种一个接一个预测下一个“词”的模型）在这两方面都

2025年5月6日16时作者机器之心

越来越重要，但在视频生成领域缺少探索。复旦大学等机构将强化学习引入到视频生成领域，经过强化学习优化的

2025年5月6日16时作者机器之心

数学家陶哲轩开发了一个验证分析估计值的工具，利用大模型辅助编写Python类并解决相关问题。