月度归档: 2025 年 2 月
刚刚!梁文锋亲自贡献:DeepSeek全面开源优化并行策略!
DeepSeek在OpenSourceWeek分享了多个开源项目,包括用于V3/R1训练的DualPipe、EPLB负载均衡算法以及用于深度学习模型的profile-data分析数据。
聪明人已经抓住DeepSeek风口发表SCI了
科研圈又有新进展!意大利研究团队借助DeepSeek模型在知名期刊发表论文,从投稿到接收仅用一天。清华大学出版《DeepSeek:从入门到精通》,详细介绍这一深度学习和人工智能工具的使用方法。此外,还有大模型实战系列课和华为全联接大会上的大模型免费试用机会。
英伟达暴力优化DeepSeek R1,推理速度暴涨25倍!
英伟达推出DeepSeek R1在Blackwell架构上的优化,其推理性能提升了25倍,成本降低了20倍。通过使用FP4精度,DeepSeek-R1实现了更低的成本和更高的效率,可能带动API价格大幅下降。
杭州国际人形机器人与机器人技术展:中国首个人形机器人主题展会,邀您共启智能未来
中国首个以人形机器人全产业链为核心的展览会将在杭州举办。展会将展示最新的人形机器人技术和应用场景,并吸引全球顶尖企业参与,助力推动我国机器人产业的发展。
阿里最新深度思考模型强不强?我们让它和Grok3比拼了下
阿里发布最新深度思考模型QwQ-Max-Preview,能够处理数学、编程及通用任务,并即将开源发布。通过对比与Grok3的表现,展示了在逻辑推理和联网搜索方面的优势。
超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!
阿里云旗下视觉生成基座模型万相 2.1(Wan)重磅开源,支持文生视频和图生视频任务。14B 和 1.3B 参数规格的全部推理代码和权重开放,并在权威评测集 VBench 中表现优异。