DeepSeek-V3 归档

重磅！阿里Qwen3超越Kimi-K2、DeepSeek-V3登顶，附一手实测

2025年7月23日14时作者 AI先锋官

短短一周，阿里Qwen3从Kimi K2夺魁到连降空降，性能提升显著。Qwen3-235B-A22B-Instruct-2507在指令遵循、逻辑推理、文本理解等多个维度上大幅提升，超过多个顶级开源模型和闭源模型，在多领域测试中表现优异。同时具备长尾知识覆盖和更高质量的用户交互能力。

2025年7月17日16时作者硅星人Pro

本文介绍了Kimi K2的发布过程及其背后的故事。文章描述了Kimi在知乎等社交媒体上进行了开放的技术分享，并通过内部工程师和研究员的讨论，让K2模型变得立体化。同时，Kimi团队还强调其公司的独特品味和文化氛围。最终，Kimi通过更透明的方式展示了自己，与整个技术社区建立了紧密联系。

2025年7月9日16时作者 Founder Park

2025年上半年大模型API市场数据分析显示，Gemini-2.0-Flash、Claude-Sonnet-4等模型表现突出；谷歌在市场份额上占据主导地位，而OpenAI则存在波动。不同领域如编程、翻译和角色扮演中，各模型使用量各异。总体来看，谷歌与Anthropic的模型占据优势。

2025年6月30日16时作者智东西

百度开源文心大模型4.5系列10款模型，涵盖多种参数规模的混合专家和稠密型模型。该系列模型在文本和多模态基准测试中达到SOTA水平，支持跨硬件平台部署。

2025年5月15日23时作者智东西

智东西5月15日消息，昨日下午，DeepSeek团队发布新论文，以DeepSeek-V3为代表，深

2025年5月15日16时作者新智元

，揭示了硬件与大语言模型架构协同设计的核心奥秘。论文展示了如何突破内存、计算和通信瓶颈，实现低成本、

2025年4月21日14时作者 AI探索时代

阿里开源的Qwen2.5系列训练数据规模达18万亿 token，推动AI大模型发展。但大规模训练带来幻象问题，RAG技术及工业场景应用以数据为中心成为趋势。国家和行业正积极推进数据标注产业发展规范，提升数据标注行业的合规能力。