文本到动作生成最强模型出炉!动作可精确编辑,北大AI团队CVPR 2025新论文

北京大学的研究人员提出了一种名为MotionReFit的新模型,它可以根据用户的文本指令生成逼真的人体动作。该模型通过引入MotionCutMix数据增强技术及带有动作协调器的自回归扩散模型来实现这一目标,支持空间和时间上的动作编辑,无需特定的身体部位规范。

碾压OpenAI!谷歌最强模型加持Deep Research性能暴涨,还在酝酿一个AI大招

谷歌发布Gemini Advanced订阅服务升级版Deep Research功能,相比OpenAI同款功能评分高出两倍多。该功能可快速生成详细的研究报告,并支持多种语言和设备使用。

赢麻了?曝英伟达将贾扬清及其公司Lepton AI收入麾下,创业仅两年,卖了数亿美元

英伟达收购人工智能初创公司Lepton AI,贾扬清和白俊杰留任。李响等阿里云技术骨干加入。Lepton AI专注于为企业提供更匹配的GPU资源云服务和开发环境,助力英伟达在AI应用开发及算力支撑领域巩固霸主地位。

图变动画新玩法!字节跳动团队提出DreamActor-M1框架,让图片超写实地“活”起来

人体图像动画研究取得新进展,字节跳动团队提出DreamActor-M1框架。该技术能实现多尺度驱动的合成、细粒度面部和身体控制,并保持长期一致性。通过混合引导机制,DreamActor-M1展示了前所未有的效果,为生成式AI行业带来新创意。

暴击Manus,拿下1.6亿美元融资,前百度副总裁景鲲带队推出Genspark超级智能体

景鲲发布的Genspark超级智能体采用混合代理系统,整合9个模型和多个数据集,提供快速、可靠且操控性强的AI服务。其功能包括旅行计划制定、个性化视频创作、新闻生成动画视频等。尽管订阅费用较高,但功能丰富,正成为AI agent领域的热门产品。