视频生成模型
通信巨头入局视频生成,直接霸榜权威评测:人物跨越多场景依然一致
中国电信人工智能研究院发布的新模型TeleAI-VAST,在16项子指标中有9项排名第一,包括物体分类、人体动作等。该模型展示了四位女主角的不同场景下的前后一致性和人物动作精准控制能力,并且实现了声音与画面的同步效果。此外,它采用了独特的两阶段生成架构,使得视频生成更加精确和可控。
生成式AI迎来窗口期,阶跃星辰加速冲刺|
生成式AI领域竞争激烈,国内大模型创业公司加速发展。阶跃星辰近期发布了多个多模态理解及生成的大模型,并取得多项国际排名前列的成绩。该公司计划通过多模态理解和生成技术实现AGI(通用人工智能),预计到2028年全球生成式AI产业支出将达到4.58万亿元。
视频生成无损提速:删除多余token,训练时间减少30%,帧率越高效果越好 NeurIPS
卡内基梅隆大学提出RLT方法,利用视频中重复图像块合并成token技术,显著提升Transformer视频生成速度,训练时间缩短30%,推理阶段提速67%。