清华张亚勤:10年后,机器人将可能比人都多
张亚勤在新书《智能涌现》中预测,未来10年后机器人可能比人都多,并进入家庭。AI技术正从“数字化3.0”升级,发展方向包括大模型、自动驾驶和生物智能。他提出了五大趋势和发展方向,强调统一标识和规模定律的重要性,以及需要新的算法体系支持通用人工智能的实现。
张亚勤在新书《智能涌现》中预测,未来10年后机器人可能比人都多,并进入家庭。AI技术正从“数字化3.0”升级,发展方向包括大模型、自动驾驶和生物智能。他提出了五大趋势和发展方向,强调统一标识和规模定律的重要性,以及需要新的算法体系支持通用人工智能的实现。
基于Transformer的自回归视觉生成模型在图像生成领域的表现受到了质疑。然而,复旦大学和字节Seed的研究者们提出了一种新方法SimpleAR,在0.5B参数规模下实现了高质量图像的生成,并通过优化训练过程提升了模型的效果。
阿里通义万相Wan2.1最新版发布,基于首尾帧技术能生成流畅、连贯的5s/720p视频。模型参数规模达到百亿级,支持在官网和多个开源平台使用。实测显示其表现优秀,具备较强的主体一致性、前后连贯性和细节把控能力。
哈工大博士生李俊劼的研究成果GiVE首次实现了指令驱动的全景式感知,解决了传统多模态模型’选择性失明’的问题。通过引入AG-Adapter模块和设计三种专门损失函数,GiVE能灵活调整注意力焦点,提升多模态任务表现。
新一代通用智能机器人AlphaBot 2在学习能力和自主执行任务方面表现出色,能够360°感知周围环境并完成多种复杂任务。智平方与华熙生物达成合作,将机器人应用于生物科技领域。
谷歌新推出Gemini 2.5 Flash预览版,性价比高且支持自由调控思考深度。在大模型竞技场中排名第二,并在编程和数据分析能力上超过o4-mini。
姚顺雨指出AI发展分为上半场和下半场。上半场以模型和方法为主,而下半场的重点转向如何定义现实任务并有效评估AI的表现。他强调强化学习已能泛化,并提出新的评估规则来解决当前局限性。