DeepSeek-V3 归档 - 第5页共5页 - 每时AI

OpenAI科学家盛赞中国大模型：算法非常强，算力用到极致！

2024年12月30日8时作者 AIGC开放社区

OpenAI联合创始人Andrej Karpathy分享了中国开源大模型DeepSeek-v3，仅使用280万小时GPU算力即超越Llama-3。该模型在多种基准测试中表现优异，并采用MLA和MoE等高效策略节省大量计算资源。

AI Weekly『12月23-29日』：DeepSeek-V3开源发布，xAI完成60亿美元C轮融资！

2024年12月29日14时作者 AI信息Gap

本周最受关注的进展包括DeepSeek发布6710亿参数模型DeepSeek-V3、智谱开源GLM-PC基座模型CogAgent-9B、阶跃星辰推出增强型AI图像模型Step-1X-Medium、阿里通义千问开源视觉推理模型QVQ-72B-Preview、马斯克xAI完成60亿美元C轮融资以及Cursor融资1亿美元。这些进展涵盖了AI领域的算法优化、模型性能提升及投资动态，体现了技术进步和行业发展的前沿方向。

国产 AI 一夜刷屏海外！2000 块 GPU 打造 GPT-4o 平替， AI 大佬纷纷点赞

2024年12月27日18时作者 APPSO

一
夜之间，中国大模型在国际上狠狠秀了一波肌肉。
近日，国产大模型厂商 DeepSeek 宣布
De

DeepSeek-V3外网刷屏爆火，训练成本只有600万，把AI大佬都炸出来了

2024年12月27日18时作者 Founder Park

DeepSeek V3 发布并同步开源，直接在外网刷屏了。
延续便宜大碗特点的基础之上，DeepSe

突然刷屏的ai界“拼多多”deepseek

2024年12月27日14时作者 AI先锋官

年底沉寂的AI 行业，突然被一家中国公司刷屏。DeepSeek-v3 发布后，性能比肩GPT-4、Claude 3.5等开源模型。作为华裔，Alexandr Wang 称其为“全球最佳开源LLM”，并称赞其高效生成方式和成本优势。

国产大模型DeepSeek-V3一夜火爆全球，671B的MoE，训练成本仅558万美元

2024年12月27日12时作者机器之心

机器之心报道
机器之心编辑部
今天，一个国产大模型火遍了世界。
打开 X，满眼都是讨论 DeepSe

智谱开源CogAgent AI自动屏幕操作，DeepSeek-V3低调但效果好到刷屏，AI个人简历的平台

2024年12月27日10时作者每日AI新工具

本文介绍了5款AI模型和技术产品：CogAgent改进视觉语言模型的GUI代理；DeepSeek-V3参数量大的混合专家语言模型；Valley 2.0字节跳动开发的多模态大模型；devb.io简化生成开发者个人简历的过程；Memory Layers提供大规模分布式训练的参考实现。

Deepseek v3正式发布：用557.6万美金超越Claude 3.5 Sonnet的惊人杰作

2024年12月27日10时作者 AI寒武纪

2024年12月26日，DeepSeek AI发布其最新大型语言模型DeepSeek-V3，每秒处理60个token，采用FP8训练、MoE架构、无辅助损失负载均衡策略和多令牌预测目标等技术。该模型仅花费不到600万美金完成训练，并且支持高效推理与本地部署。