Meta新视频生成框架拿捏倒立杂技,双人舞也能完美同步!运动一致性暴增近20%,可无缝集成DiT模型

Meta GenAI团队提出的新框架VideoJAM显著提升了视频生成中的运动一致性,其效果超越了Sora等模型。VideoJAM能够处理复杂且迅速的动作,并与现有DiT模型无缝集成,提升运动质量达19.67%至4.88%。

2025 AI手机交互体验:它能说会道,有眼有脑,是更聪明更懂你的AI伙伴

超级小布助手通过多模态能力,包括视觉识别、语音理解与执行指令等功能,使手机交互方式发生改变。它支持用户使用电源键唤起小布助手,并具备强大的视觉理解和响应能力,如识屏问答和导航功能。

通信巨头入局视频生成,直接霸榜权威评测:人物跨越多场景依然一致

中国电信人工智能研究院发布的新模型TeleAI-VAST,在16项子指标中有9项排名第一,包括物体分类、人体动作等。该模型展示了四位女主角的不同场景下的前后一致性和人物动作精准控制能力,并且实现了声音与画面的同步效果。此外,它采用了独特的两阶段生成架构,使得视频生成更加精确和可控。