超越Sora!阿里正式完全开源最新、最强大的视频生成模型 Wan2.1

阿里巴巴通义实验室开源最新视频生成模型Wan2.1系列,亮点包括复杂运动、物理模拟、电影质感等。Wan2.1-I2V-14B为图像到视频领域天花板;Wan2.1-T2V-14B支持中英文文字生成,性能卓越;Wan2.1-T2V-1.3B适合消费级显卡。模型采用3D因果VAE、特征缓存机制等技术。

DeepSeek开源第四弹放大招:一口气放出并行计算优化三剑客「训练速度,GPU利用,优化经验」

DeepSeek 开源周第四天推出三剑客,包括DualPipe、EPLB和profile-data项目。DualPipe优化计算与通信重叠;EPLB实现专家并行负载均衡;profile-data提供模型训练和推理的性能分析数据。

腾讯混元团队提出MM-IQ:多模态大模型推理评估新基准

腾讯 Hunyuan 团队提出 MM-IQ 基准测试框架,旨在评估多模态模型的抽象推理和逻辑思维能力。该基准包含 8 种不同推理范式,涵盖 2,710 个精心策划的测试项目,涉及逻辑运算、数学推理等多样化的题目配置。

扎克伯格来救市了?报道称Meta正筹划2000亿美元巨型数据中心

据报道,Meta正在商讨建立一个新的数据中心园区用于其人工智能业务。该项目可能超过2000亿美元规模最大,并需要5-7千兆瓦的电力供应。扎克伯格筹划的大动作可能缓解市场对数据中心过剩的担忧。