机器之心
刚刚,OpenAI放弃营利性转型!奥特曼:非营利组织继续掌控,AGI造福全人类使命不变
OpenAI 发布公告,宣布放弃将公司完全转为营利性机构的计划,并继续由非营利组织控制。公司转型为公益公司(PBC),维持相同的使命——确保通用人工智能造福全人类。
边学边练,推理觉醒:LUFFY让强化学习即学即用!
AI模型训练中常见的两种策略——模仿学习和强化学习各有弊端。上海、西湖大学等团队提出LUFFY,结合两者优势,通过混合策略和策略塑形函数提升推理能力,实现即学即练的效果,已在GitHub开源。
成熟的编程智能体,已经学会升级自己的系统了
研究人员提出了一种自我改进编码智能体(SICA),能够编辑自己的代码库,并在成本、速度和基准性能方面进行自我改进,该研究展示了自我参照式元智能体编程的可行性。
谷歌DeepMind:大模型也很任性,知道最优路径偏要撞南墙
该研究系统地分析了大语言模型在决策场景中的表现次优原因,并提出通过强化学习对自动生成的思维链推理过程进行微调,以缓解贪婪性、频率偏差和知行差距问题。
CVPR 2025 Oral DiffFNO:傅里叶神经算子助力扩散,开启任意尺度超分辨率新篇章
本文提出了一种名为 DiffFNO 的方法,利用神经算子和扩散模型解决超分辨率问题。它通过加权傅里叶神经算子、门控融合机制和自适应 ODE 求解器实现了高精度和快速推理,超越了现有技术。
谷歌NotebookLM终于说中文了!这可是最火的大模型播客产品
NotebookLM 现在支持中文播客,成为多语言AI知识助手。它能将文本、视频等内容转化为引人入胜的AI播客,帮助用户整理信息并提高效率。
CVPR 2025 如何稳定且高效地生成个性化的多人图像?ID-Patch带来新解法
本文提出ID-Patch方案,用于解决多人图像生成中的身份特征泄露问题。通过ID Patch将身份特征转化为小尺寸RGB图像块,精确指定每个人的位置,并与文本提示共同输入增强人物面部真实性。实验结果显示其在身份还原和位置匹配上表现优秀,且生成效率快。