学术归档 - 第172页共283页

DeepSeek R1也会大脑过载？UC伯克利等新作揭示：少琢磨让计算成本直降43％

2025年3月4日16时作者 PaperWeekly

样，在「用脑过度」也会崩溃，进而行动能力下降。
近日，加州大学伯克利分校、UIUC、ETH Zuri

2025年3月4日16时作者机器之心

在人工智能领域，直接偏好优化(DPO)方法因其简单易用和稳定性而受到广泛关注，但其训练过程中会出现似然位移现象。本文提出DPO-Shift方法，在Bradley-Terry模型中增设参数函数以缓解该问题，并通过理论分析与实验验证了其有效性。

2025年3月4日16时作者 PaperWeekly

些成功的案例表明，在大规模代码数据上进行预训练可以显著提升模型的核心编程能力。
除了预训练外，一些通

2025年3月4日16时作者机器之心

视觉强化微调项目 Visual-RFT 通过规则奖励和强化学习方法，实现了视觉语言模型在目标检测、分类等任务中的高效提升。项目已开源，欢迎加入。

2025年3月4日16时作者机器之心

模型（Mixture-of-Experts, MoE）的技术，而当前的 MoE 技术依然还有显著的优

2025年3月4日16时作者 PaperWeekly

CVPR 2025录用结果出炉！今年共13008篇论文投稿，最终录取率仅为22.1%。大模型时代的研究方向集中在端到端、闭环仿真3DGS、多模态大模型和扩散模型等前沿领域。科研辅导服务帮助学生解决选题、实验设计、创新点设计等问题。

2025年3月4日12时作者 HyperAI超神经

所 Mila、蒙特利尔大学、麻省理工学院的研究团队，开发出了一种新型大规模流式蛋白质主链生成器 ——

2025年3月4日12时作者机器之心

Anthropic 宣布完成35亿美元E轮融资，投后估值达615亿美元。该资金将用于开发下一代AI系统、增强计算能力及深化研究。

2025年3月4日12时作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，