泛化能力
ICML 2025 清华、上海AI Lab等提出傅里叶位置编码,多项任务远超RoPE
清华大学团队提出傅里叶位置编码(FoPE),通过鲁棒性强的位置编码克服Transformer在处理长文本时的周期性延拓限制,显著提升模型的长文本泛化能力。
AI无师自通,搞定所有家务!π0.5突破泛化极限,UC伯克利系出品
新智元报道
具身智能公司Physical Intelligence推出π0.5 VLA模型,通过异构任务协同训练实现广泛泛化能力,机器人能在多种环境中完成复杂任务。
字节开源AI图像模型UNO:一个模型统一多个任务,开启更强大的可控生成能力
UNO 是字节跳动开源的研究成果,是一个可以同时支持单主体和多主体图像生成的AI模型。它解决了当前AI图像生成领域的数据扩展和主体扩展问题,并展示了强大的泛化能力,能够适应多种应用场景。
谷歌连推两款「机器人大脑」!Gemini Robotics:折纸、扣篮、装饭盒不在话下
谷歌DeepMind发布Gemini Robotics和Gemini Robotics-ER两款AI模型,让机器人能理解复杂环境、执行精细任务,并具有更好的泛化能力、交互性和灵活性。