2025年哪款模型最受欢迎?Poe最新报告:DeepSeek降温、可灵成黑马

AI 工具聚合平台 Poe 发布了其最新一期的人工智能模型使用趋势报告。这次的报告分析汇总了从 2025 年 1 月至 2025 年 5 月期间,Poe 用户在文本、推理、图像、视频和音频领域的每周使用数据。

在各种能力测评榜单之下,模型在真实场景下的能力如何?哪些模型更好用?Poe 的报告数据,反映了用户使用大模型时的一些真实需求和使用模式。

报告得出的几个核心观察点:

  • 随着时间的发展,DeepSeek 模型的「爆红期」已经过去,同时其他定价合理、支持长上下文的推理模型也陆续发布, DeepSeek R1 的消息份额从 2 月中旬的 7% 峰值下降到 4 月底的 3%。

  • 同一提供商发布的新一代旗舰模型往往会抢占其上一代模型/产品的市场份额。在此趋势下,Poe 订阅用户会迅速地转向使用新一代模型;

  • 在 Poe 中,用户发给推理模型的文本消息总份额从约 2%上升到了约 10%,在 DeepSeek 热度高峰期达到顶峰。具备混合推理能力的模型已初步得到应用,但目前在子类别中的总体使用量仍然较小,占比约为 1%。

  • GPT 图像生成模型 GPT-Image-1 于 4 月末开放了 API 接口。在短短两周时间内,该模型的图像生成使用率迅速达到了 17%;

  • 快手发布的视频生成模型 Kling-2.0-Master 在其发布后的三周内,在 Poe 的所有视频生成请求中占比迅速达到了 21%;

  • 在音频生成领域,ElevenLabs 更受用户青睐,处理了约 80% 的订阅用户的 TTS 请求。


Founder Park 正在搭建「AI 产品市集」社群,邀请从业者、开发人员和创业者,扫码加群: 

进群后,你有机会得到:
  • 最新、最值得关注的 AI 新品资讯; 

  • 不定期赠送热门新品的邀请码、会员码;

  • 最精准的AI产品曝光渠道



01 

模型新版本推出速度太快,

市场份额消长明显


随着 OpenAI 的 GPT-4.1 系列和谷歌的 Gemini 2.5 Pro 模型在编程任务中的能力表现的提升,两者在发布后数周内的消息份额迅速增长,分别接近 10%和 5%。

与此同时,Anthropic 的 Claude 系列模型(例如 Claude 3.5 Sonnet 和 Claude 3.7 Sonnet)在同一时期内受到影响,绝对份额下降了接近 10%。

随着时间的发展,DeepSeek 模型的「爆红期」已经过去,同时其他定价合理、支持长上下文的推理模型也陆续发布, DeepSeek R1 的消息份额从 2 月中旬的 7% 峰值下降到 4 月底的 3%。

与 Poe 在今年 3 月发布的上一份报告的观察类似,我们发现到同一提供商发布的新一代旗舰模型往往会抢占其上一代模型/产品的市场份额。在此趋势下,Poe 订阅用户迅速地转向使用新一代模型 Claude-3.7-Sonnet,但 Claude-3.5-Sonnet 在大语言模型中仍保持了约 12% 的总体使用率。


02 

推理模型势头正劲,

市场份额显著扩大

2025 年以来,前沿实验室推出了更多能够投入时间和计算资源以更精准、更可靠地处理复杂任务的模型。推理模型的数量显著增加。

值得注意的是,在 Poe 中,用户发给推理模型的文本消息总份额从约 2%上升到了约 10%,在 DeepSeek 热度高峰期达到顶峰。

以下是具备推理能力的模型在文本消息中的份额占比情况。

在 Poe 订阅用户中, Gemini 2.5 Pro 的使用量迅速增长,该模型发布后的 6 周里,获得了约 30%的推理消息份额。

OpenAI 在 2024 年末发布了具有标志性意义的推理模型 o1-preview 后,随后又迅速推出了一些性能更强大且价格更合理的推理模型,在 2025 年相继发布了 o1-pro、o3-mini、o3-mini-high、o3 和 o4-mini。

在 OpenAI 的推理模型中,订阅用户正迅速转向使用 OpenAI 最新发布的模型,例如,从 o3-mini 到 o4-mini,从 o1 到 o3。

2025 年 2 月,xAI 的 Grok 3 公开发布时,模型在多项问题解决基准测试中表现出色, Grok-3-mini 仍然是该系列中唯一支持通过 xAI API 进行推理的模型,这或许是导致其在推理模型总使用量中占比不足 1% 的一个因素。

我们注意到,具备混合推理能力的模型已初步得到应用,例如 Gemini 2.5 Flash Preview 和 Qwen 3,这些模型能够根据对话内容灵活调整推理能力,并支持受控决策。但目前它们在子类别中的总体使用量仍然较小,占比约为 1%。


03 

随着生成质量和准确性的提升,

图像生成模型竞争加剧

GPT 图像生成模型 GPT-Image-1 于 4 月末开放了 API 接口。在短短两周时间内,该模型的图像生成使用率迅速达到了 17%。

谷歌的 Imagen 3 系列模型在 2025 年期间使用量稳定增长,从约 10% 增长至 30%,其使用率与 Black Forest Labs 的 FLUX 系列图像生成模型大致持平,后者在 4 月最后一周的总市场份额约为 35%。

图像生成领域的 FLUX 家族在 Poe 平台上的总使用份额出现了小幅下滑,从约 45% 降至约 35%,但在整体市场中的份额依然可观。


04 

视频生成领域「黑马」:

Kling 2.0 三周内迅速占据三成的使用份额

在视频方面,快手发布的 Kling 视频生成系列模型迅速占据了约 30% 的使用份额,特别是 Kling-2.0-Master 模型,该模型在 2025 年 4 月末发布后的三周内,在 Poe 的所有视频生成请求中占比达到了 21%。

谷歌的 Veo 2 模型在今年 2 月发布后的几个月时间内,保持了约 20% 的强劲使用份额。

作为定义视频生成领域的先行者, Runway 在报告期内的使用份额下降了约 40%,跌至了约 20%。


05 

 ElevenLabs 保持领先,

音频生成领域新玩家竞争激烈

在音频生成领域(尤其是文本转语音,TTS), ElevenLabs 更受用户青睐,处理了约 80% 的订阅用户的 TTS 请求。

同时,音频生成领域的竞争也十分激烈,例如 Cartesia、 Unreal Speech、 PlayAI 和 Orpheus 等,这些平台提供了独特的声音选项、音效以及不同的性能和价格方案。


注:

[1] 所有用户信息均按照 Poe 的隐私政策进行处理,该政策明确禁止模型提供方将用户通过 Poe 提交的任何输入用于模型训练。

[2] 我们欢迎各界对我们的方法论提出任何评论或批评。所有展示的使用数据均基于 Poe 订阅用户的使用行为。图表中每个条形代表一周(从周一到周日)的使用数据。所有图表的数据均已标准化为百分比份额,以便更好地反映模型在订阅用户总使用量中的相对占比,并控制总订阅用户数随时间增长带来的影响。需要注意的是,在报告期间模型的价格点可能发生变化,这或许会对使用情况产生影响。在进行文本模式分析时,发送给 Poe 助手机器人的消息已被排除在外,这是为了更准确地体现用户对特定命名模型的明确偏好和需求所驱动的使用情况。

[3] 在文本消息份额图中,GPT-4.1 涵盖 GPT-4.1、GPT-4.1-mini 和 GPT-4.1-nano;GPT-4o 包含 GPT-4o、ChatGPT-4o-最新 和 GPT-4o-mini;GPT-4 包含 GPT-4-Classic 和 GPT-4-Turbo;o1 包含 o1、o1-预览 和 o1-mini;o3 包含 o3、o3-mini 和 o3-mini-high;Claude-3.7-Sonnet 分组包含所有发送给 Claude-3.7-Sonnet 和 Claude-3.7-Sonnet-推理 的消息,不论其是否被标记为推理请求;而在专门的推理类别统计中,只有推理参数(如推理 token 数)设定为非零值的请求才会被计入;Gemini-2.5 包含其 Pro 和 Flash 变体;Gemini-2.0 包含 Gemini-2.0-Flash、Gemini-2.0-Flash-Lite 和 Gemini-2.0-Flash-Exp;Gemini-1.5 包含其 Pro 和 Flash 变体;Grok-3 包含 Grok-3 和 Grok-3-Mini。

[4] 为更准确地反映用户直接的偏好和需求,由 Poe 平台的动画按钮或其他自动后续操作触发的视频生成请求已在此分析中排除。

[5] 截至本报告发布时, Poe 平台上的 Runway 机器人仍连接到 Gen-3-Alpha-Turbo API 端点,尚未更新至 Gen-4-Alpha-Turbo 端点。

[6] 为更准确地体现用户直接的偏好和需求,由 Poe 平台的说话按钮或其他自动后续操作触发的音频生成请求已在此分析中排除。

(文:Founder Park)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往