亿级短视频数据突破具身智能Scaling Law!Being-H0提出VLA训练新范式
北京大学卢宗青团队提出创新性解决方案,利用海量人类操作视频数据构建大规模预训练VLA模型Being-H0,并成功应用于真实机器人平台上。该研究解决具身智能领域真机数据不足的问题,提升机器人操作任务的成功率和效率。
北京大学卢宗青团队提出创新性解决方案,利用海量人类操作视频数据构建大规模预训练VLA模型Being-H0,并成功应用于真实机器人平台上。该研究解决具身智能领域真机数据不足的问题,提升机器人操作任务的成功率和效率。
南洋理工大学提出CAFT技术,首次将多token预测引入模型微调阶段,实现模型对完整概念的理解,提高编程、数学和医学等多个领域的性能。
上海交通大学朱怡飞教授团队提出LLMSched调度框架,通过引入三类新节点和贝叶斯网络实现复合LLM应用的高效调度,相较于现有调度器平均任务完成时间降低14~79%。
OpenAI寻求新一轮400亿美元融资支持星际之门项目,但与软银因选址和规模争议而闹掰。OpenAI内部面临人才流失、运营资金短缺等问题,外界担心其未来前景。
浙大校友团队推出TestSprite 2.0,仅需30分钟即可完成零代码网站构建,并通过智能测试和AI自动生成测试报告及修复错误,大幅提升代码准确率。
OpenAI CEO奥特曼透露GPT-5发布前的‘天啊时刻’,称孩子从出生起就永远不如AI聪明。他强调AI与人类能力的不同,并提到现有的硬件无法适配人工智能。
扩散语言模型(dLLMs)因并行解码、双向上下文建模和灵活插入masked token而备受关注。然而,上海交通大学等团队在最新研究中指出,dLLMs存在根本性架构安全缺陷,几乎毫无防御能力。DIJA攻击无需训练或改写模型参数,就能生成有害内容,并揭示了扩散语言模型的弱点,为dLLMs的安全研究拉开序幕。
南洋理工大学与上海人工智能实验室提出首个全面的物理属性3D数据集PhysXNet,包含超过26K带有丰富注释的3D物体,涵盖五种核心物理属性,并介绍了一种基于此的数据生成框架PhysXGen。