生成越长越跑偏?浙大商汤新作StarGen让场景视频生成告别「短片魔咒」

浙江大学章国锋教授和商汤科技研究团队提出的StarGen解决了复杂场景的长距离生成一致性问题,通过时空条件结合视频扩散模型实现了高质量、多视一致的生成。

刚刚,阶跃星辰发布Step R-mini!推理模型从此不再文理偏科

阶跃星辰发布的Step Reasoner mini是首个推理模型,擅长逻辑推理、代码和数学问题,并能进行文学创作。该模型通过强化学习训练,实现文理兼修。它在AIME 2024和Math500测试中均表现出色,且具有较好的泛化性。

书生·浦语大模型升级,突破思维密度,4T数据训出高性能模型

上海人工智能实验室对书生大模型进行了升级,推出了InternLM3.0版本,通过精炼数据框架提升了数据效率和思维密度,节约了75%以上训练成本,并实现了常规对话与深度思考能力融合。

港科大、地平线提出DrivingWorld:基于视频GPT构建自动驾驶世界模型

港科大与地平线联合提出DrivingWorld模型,采用基于自回归架构的方法实现精准的自动驾驶世界模型。通过空间-时间先解耦后融合机制和next-state预测策略,实现超长时序视频生成及可控性提升。