AI智能体全新摩尔定律震撼诞生:AI研发能力每7个月翻一番!五年替代人类开发团队? 2025年3月21日16时 作者 新智元 尔定律:过去6年中,AI完成任务的长度,每7个月就会翻一番!如此下去,五年内我们就会拥有AI研究员,
谷歌连推两款「机器人大脑」!Gemini Robotics:折纸、扣篮、装饭盒不在话下 2025年3月13日16时 作者 新智元 谷歌DeepMind发布Gemini Robotics和Gemini Robotics-ER两款AI模型,让机器人能理解复杂环境、执行精细任务,并具有更好的泛化能力、交互性和灵活性。
北大团队提出LongRePS框架:面向长上下文场景的思维链过程监督方案 2025年3月13日16时 作者 PaperWeekly 上下文建模 研究简介 当前大语言模型(LLMs)在处理长上下文任务时面临核心挑战:如何在超长输入中有
小红书基于 PPO 的多模态大模型 RLHF 系统的设计与优化 2025年3月12日23时 作者 AI前线 术变革转向产业变革,大模型应用也会进一步繁荣,传统基础设施技术已经不足以满足大模型应用的快速发展。整
已节省数百万GPU小时!字节再砍MoE训练成本,核心代码全开源 2025年3月10日23时 作者 量子位 可节省40% ! 刚刚,豆包大模型团队在GitHub上开源了叫做 COMET 的MoE优化技术。 C
1.5B硬刚GPT-4o,CMU祭出LCPO提示可控思考!每token性能较S1暴涨2倍 2025年3月9日23时 作者 新智元 1模型,结果令人震惊:在数学推理任务中,它比S1相对提升100%以上,在逻辑推理和MMLU等非训练任
再看文档解析该如何做?pipeline派及end2end两派路线及代表工具 2025年3月5日14时 作者 老刘说NLP 主要方向之一。 我们在 文档智能专 题 https://mp.weixin.qq.com/mp/ap
ICLR’25|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2 2025年2月24日23时 作者 极市干货 GaussianV2,能够在快速实现训练和压缩的同时,得到精准的几何结构与逼真的实时渲染体验。 >>
出人意料!DeepSeek-R1用的GRPO其实非最优?规模化强化学习训练用PPO就够了 2025年2月21日23时 作者 机器之心 Group Relative Policy Optimization)非常关键,是 DeepSeek