超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!
阿里云旗下视觉生成基座模型万相 2.1(Wan)重磅开源,支持文生视频和图生视频任务。14B 和 1.3B 参数规格的全部推理代码和权重开放,并在权威评测集 VBench 中表现优异。
阿里云旗下视觉生成基座模型万相 2.1(Wan)重磅开源,支持文生视频和图生视频任务。14B 和 1.3B 参数规格的全部推理代码和权重开放,并在权威评测集 VBench 中表现优异。
中国电信人工智能研究院发布的新模型TeleAI-VAST,在16项子指标中有9项排名第一,包括物体分类、人体动作等。该模型展示了四位女主角的不同场景下的前后一致性和人物动作精准控制能力,并且实现了声音与画面的同步效果。此外,它采用了独特的两阶段生成架构,使得视频生成更加精确和可控。