机器之心，作者每时AI - 第83页共134页

英伟达RTX 5070评测解禁：老黄承诺4090级性能？不存在的

2025年3月5日23时作者机器之心

ce RTX 5070 显卡正式解禁，各种评测开始进入人们的视线。
我们知道，最近英伟达 RTX 5

2025年3月5日23时作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

2025年3月5日23时作者机器之心

强化学习先驱 Andrew Barto 与 Richard Sutton 获得今年的 ACM 图灵奖。他们提出的强化学习理论为 AI 研究奠定了基础，并在机器人技能学习、网络拥堵控制等领域取得了成功。

2025年3月5日23时作者机器之心

字节跳动 ByteDance Research 团队开发并开源了 ByteQC，一款基于 GPU 加速的大规模量子化学计算工具集，显著加速了量子化学算法，并实现了更大规模的模拟。

2025年3月5日16时作者机器之心

我们也能让 Llama 学会自我改进。
给到额外的计算资源和「思考」时间，为什么有的模型能好好利用，

2025年3月5日16时作者机器之心

AIxiv专栏介绍及新模型MoM发布。MoM通过混合记忆机制实现大规模内存扩展，显著提升长序列建模能力，在in-context recall-intensive任务上超越Transformer。

2025年3月4日16时作者机器之心

03 年，一位名叫 Britta Späthen 的德国研究生首次接触到了麦凯猜想（McKay co

2025年3月4日16时作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

2025年3月4日16时作者机器之心

在人工智能领域，直接偏好优化(DPO)方法因其简单易用和稳定性而受到广泛关注，但其训练过程中会出现似然位移现象。本文提出DPO-Shift方法，在Bradley-Terry模型中增设参数函数以缓解该问题，并通过理论分析与实验验证了其有效性。

2025年3月4日16时作者机器之心

视觉强化微调项目 Visual-RFT 通过规则奖励和强化学习方法，实现了视觉语言模型在目标检测、分类等任务中的高效提升。项目已开源，欢迎加入。