不蒸馏R1也能超越DeepSeek,上海 AI Lab 用RL突破数学推理极限

上海AI Lab提出的新方法OREAL利用基于结果奖励的强化学习超越了DeepSeek,无需超大规模模型蒸馏。通过模仿正样本、偏好负样本并关注关键步骤,实现了数学推理任务上的显著提升,并开源训练数据和模型以促进研究对比。

微信DeepSeek入口已接通,辐射用户14亿!刚刚实测,辛弃疾都得666

微信正式接入DeepSeek-R1,并支持满血版AI搜索。用户可通过微信搜索获取答案,生成结果带有社交属性可分享给朋友或朋友圈。此次接入不仅满足了用户的即时需求,还展示了微信与大模型R1的深度融合。

免手术AI读心术新突破!Meta脑机接口研究惊呆网友:能边睡边玩手机发帖了??

Meta研究人员通过结合AI模型Brain2Qwerty和非侵入性脑电图(EEG)或脑磁图(MEG),实现了当前最准确的大脑打字技术,字符错误率分别达到32%和67%,展示了脑机接口在语言生成方面的进展。

真假难辨!阿里升级AI人像视频生成,表情动作直逼专业水准

EMO2 是阿里巴巴通义实验室提出的一个音频驱动人像 AI 视频生成的升级版本,通过一张人物肖像图片和任意长度音频生成流畅自然的手部动作、面部表情及身体姿态。