MoE架构归档 - 每时AI

一键部署 gpt-oss-20b，实测开源推理模型新 SOTA，性能直逼 o3‑mini

2025年8月8日23时作者 HyperAI超神经

OpenAI 开源了两个大模型 gpt-oss-120b 和 gpt-oss-20b，前者适合复杂推理和知识密集型场景，后者适用于低延迟、本地或专业垂直领域。gpt-oss-120b 性能媲美 OpenAI o4-mini，gpt-oss-20b 也接近 o3-mini 的表现。HyperAI超神经提供了部署 gpt-oss-20b 的教程，并分享了模型在实际任务中的测试结果。

四大“上海英伟达”CEO罕见聚首，阶跃星辰获融资且年营收目标10亿

2025年7月26日16时作者钛媒体AGI

C）大会暨人工智能全球治理高级别会议今天在上海启幕。
本届WAIC以“智能时代同球共济”为主题，来

阿里Qwen新王炸！480B代码模型Qwen3-Coder开源，Agent能力开源第一

2025年7月23日12时作者 AI寒武纪

Qwen团队发布开源模型Qwen3-Coder，支持480B参数的Moe架构，具备代码和代理任务处理能力，并提供了CLI工具、Cline集成方案等便捷调用方式。

“大模型六小虎”被曝获20亿融资，放出首个推理模型技术秘籍！

2025年7月15日23时作者智东西

月15日消息，近日，“大模型六小虎”之一MiniMax新动向频发。
昨日，据晚点报道，MiniMax

新版 Kimi 突然发布！首个万亿开源模型不是 R2 是 K2，OpenAI 临时推迟开源附实测体验

2025年7月12日12时作者 APPSO

不到半年，国产开源大模型经历了显著变化。DeepSeek凭借高性能和性价比迅速崛起并主导了这一领域。目前，Kimi 推出的 K2 模型在多任务中表现出色，并通过官方部署支持主流推理引擎。

Kimi首个万亿参数模型开源！免费可用，超强Agent推理，附实测体验

2025年7月12日8时作者智东西

国内大模型独角兽月之暗面发布并开源了其最新一代MoE架构基础模型Kimi K2，总参数量达到1万亿（1T），并在SWE Bench Verified、Tau2和AceBench三项基准测试中取得SOTA成绩。

开源DeepSeek R1增强版：推理效率快200%，创新AoE架构

2025年7月4日8时作者 AIGC开放社区

专注AIGC领域的专业社区分享了DeepSeek R1增强版Chimera的进展及其优越性能。该版本相较于R1-0528版本推理效率提升200%，同时在MTBench、AIME-2024等测试基准中表现出色。

小红书开源首个大模型，11万亿非合成训练数据

2025年6月9日8时作者 AIGC开放社区

国内社交平台小红书开源首个专家混合模型Dots.llm1，参数规模达1420亿，使用11.2万亿token非合成数据训练，在中文测试中表现优异。