超低成本复现QwQ!数学推理模型训练迎来RL暴击,数据代码模型全开源 蚂蚁&清华出品

蚂蚁清华团队开源的AReaL-boba框架,显著提升了模型训练效率和推理能力。32B规模模型仅需200美元、200条数据即可复现,且在数学推理上达到SOTA水平,训练吞吐性能提升显著,成本大幅降低。

Gen-4掀翻AI视频牌桌!一条龙制作故事短片,只需提示词和参考图

Runway发布新一代视频生成模型Gen-4,支持从单张照片生成电影级别的动态视频,并具备高保真和物理规律理解能力。Gen-4能保持角色形象一致、还原真实世界现象,已被应用到多个微电影制作中。

奥赛级AI基准来了:难倒所有模型,GPT-4o仅考34分,上海交大出品

上海交通大学GAIR Lab推出OlympicArena多学科认知推理基准测试,评估模型综合解决问题能力。尽管GPT-4也仅得34.01%整体准确率,但其他开源模型的整体准确率难以达到20%。该平台覆盖7大领域11163道题目,难度偏高,旨在检验AI的多学科综合认知能力,并提供资源支持研究。

GPT-4o骗了所有人,逐行画图只是前端特效?!底层架构细节成迷,奥特曼呼吁大家别玩了

GPT-4o图像生成引发热议。用户发现逐行生成效果只是浏览器端动画,而OpenAI为此一直在熬夜保持服务器在线。GPT-4o在版权问题上表现不一,引发了关于AI处理肖像权的讨论。

国产AI起号两周就开始自己赚钱了,全球首个“边想边干”的Agent 免费无限次

智谱新发布的新功能AutoGLM沉思和沉思,可帮助用户轻松完成多种任务并具备自主执行能力。它利用推理模型进行复杂问题的推理规划,并在成本上做到足够低,使得Agent大规模应用成为可能。

中科大提出动作价值表征学习新方法,率先填补长期决策信息的缺失

中科大研究人员提出ROUSER方法,在信息瓶颈框架下学习鲁棒动作价值表征,显著提升视觉强化学习泛化性能。该方法在12个连续控制任务中表现出色,尤其适用于背景与颜色干扰的环境。

5.28亿融资砸向杭州具身智能公司,清华叉院机器人天才坐镇,被称为“中国版Figure”

千寻智能宣布完成5.28亿元Pre-A轮融资,致力于研发通用人形机器人和具身大模型。公司计划在智能制造、物流、康养等领域应用,并与清华大学等建立合作实验室培养博士人才。