日期: 2025 年 6 月 18 日
大模型也需要自我反思,上海AI Lab合成“错题本”让大模型数学成绩提升13.3%
上海AI Lab提出LEMMA项目,通过构建‘错误-反思-修正’数据让大模型从错误中学习,Llama3-8B数学题准确率提升13.3%,有效提高模型的纠错和泛化能力。
中国霸榜视频大模型!海螺02深夜发布,性能超谷歌Veo3,指令遵循绝了
MiniMax发布AI视频生成工具海螺AI第二弹,可创建10秒1080P视频,功能涵盖逼真物理效果、精确物体交互等,目前排名第2的Artificial Analysis Video Arena Leaderboard榜单中四名厂商均为国内企业。
刚刚,Gemini 2.5系列模型更新,最新轻量版Flash-Lite竟能实时编写操作系统
Google发布了Gemini 2.5系列的新版本,包括稳定版和预览版。其中Gemini 2.5 Flash-Lite是性价比最高的模型之一,适用于需要快速处理大量任务的应用场景。
Sam Altman最新采访:我们即将破解超级智能,但社会可能依然糟糕,人形机器人是终极梦想
Sam Altman 在访谈中预测 AI 将发现新科学,并认为未来5-10年人形机器人将非常出色。他提出超级智能悖论,即使能创造超级智能系统,社会可能依然糟糕。同时描述了OpenAI的终极蓝图——无处不在的‘AI伴侣’。Altman还强调能源在构建强大AI中的重要性,并批评Meta挖角行为。