文本到动作生成最强模型出炉!动作可精确编辑,北大AI团队CVPR 2025新论文

北京大学的研究人员提出了一种名为MotionReFit的新模型,它可以根据用户的文本指令生成逼真的人体动作。该模型通过引入MotionCutMix数据增强技术及带有动作协调器的自回归扩散模型来实现这一目标,支持空间和时间上的动作编辑,无需特定的身体部位规范。

碾压OpenAI!谷歌最强模型加持Deep Research性能暴涨,还在酝酿一个AI大招

谷歌发布Gemini Advanced订阅服务升级版Deep Research功能,相比OpenAI同款功能评分高出两倍多。该功能可快速生成详细的研究报告,并支持多种语言和设备使用。

赢麻了?曝英伟达将贾扬清及其公司Lepton AI收入麾下,创业仅两年,卖了数亿美元

英伟达收购人工智能初创公司Lepton AI,贾扬清和白俊杰留任。李响等阿里云技术骨干加入。Lepton AI专注于为企业提供更匹配的GPU资源云服务和开发环境,助力英伟达在AI应用开发及算力支撑领域巩固霸主地位。

差评+翻车!Meta开源模型Llama 4被曝存在基准误导和黑幕,性能不如DeepSeek

Meta推出新模型Llama 4家族引发争议,实际测试成绩不及预期。相比DeepSeek等开源模型,在一些基准测试中表现出色,但在编码任务和长文写作方面表现不佳,引发网友质疑。

图变动画新玩法!字节跳动团队提出DreamActor-M1框架,让图片超写实地“活”起来

人体图像动画研究取得新进展,字节跳动团队提出DreamActor-M1框架。该技术能实现多尺度驱动的合成、细粒度面部和身体控制,并保持长期一致性。通过混合引导机制,DreamActor-M1展示了前所未有的效果,为生成式AI行业带来新创意。