月度归档: 2025 年 2 月
DeepSeek开源周第四弹!3大猛料一口气发完,梁文锋亲自贡献
DeepSeek开源三大优化策略:DualPipe、EPLB和profile-data。DualPipe实现并行算法减少训练空闲时间;EPLB平衡负载避免GPU闲置。
AI未来的机遇与潜力在哪?世界经济论坛联合埃森哲、毕马威发布权威报告
世界经济论坛发布两份报告,强调AI在效率提升、收入增长和客户体验优化等方面的机遇,并指出规模化应用面临的挑战。《AI in Action: Beyond Experimentation to Transform Industry 2025》探讨了AI的未来潜力及成功的实施基础;《Blueprint for Intelligent Economies》则提出通过区域合作构建可持续AI基础设施,推动包容性增长和缩小数字鸿沟。
不要自回归!扩散模型作者创业,首个商业级扩散LLM来了,编程秒出结果
首个商业级扩散大型语言模型Mercury发布,每秒生成超过1000个token,性能和效率显著提升。相比现有自回归LLM,其速度提高了5到10倍,同时保持了高精度。
超越Sora!阿里正式完全开源最新、最强大的视频生成模型 Wan2.1
阿里巴巴通义实验室开源最新视频生成模型Wan2.1系列,亮点包括复杂运动、物理模拟、电影质感等。Wan2.1-I2V-14B为图像到视频领域天花板;Wan2.1-T2V-14B支持中英文文字生成,性能卓越;Wan2.1-T2V-1.3B适合消费级显卡。模型采用3D因果VAE、特征缓存机制等技术。