AI音效90秒长时可控生成!“狼嚎2秒,蟋蟀鸣8秒”精准搞定!清华&生数科技新研究入选ACM MM 2025

文生音频系统FreeAudio实现精确时间控制与90秒长时音频生成,相比现有方法具有显著提升。它无需额外训练即可同时支持时间和长时生成,并在多个指标上优于主流方法。

机器人高层指挥低层做,“坐标系转移接口”一次演示实现泛化学习 ICML2025

美国东北大学和波士顿动力RAI提出HEP框架,让机器人仅凭少量演示便能在复杂场景中高效适应。该框架采用分层结构、空间对称性泛化及体素编码器,显著提升灵活性与效率。

李开复入场Agent!零一万物推出“万仔”,直接对话CEO走独特“一把手工程打法”

零一万物发布万智2.0版本,推出企业级Agent智能体万仔。强调通过‘一把手工程’推动AI战略转型,并提供五大功能的数字员工解决方案,助力企业提升效率和生产力。