推理模型归档 - 第5页共8页

速递｜英伟达黄仁勋强调DeepSeek利好英伟达，将2025年实现强劲增长

2025年2月27日16时作者 Z Potentials

Nvidia CEO 黄仁勋在财报电话会议上重申DeepSeek不会影响销售，并强调其旗下的R1模型对Nvidia来说是重大利好消息。黄仁勋还宣布NVIDIA专为推理定制的最新Blackwell芯片需求强劲，公司收入创纪录达到393亿美元。

2025年2月25日16时作者 AI前哨站

南都消息：字节跳动旗下豆包聊天机器人推出显示推理过程的思维链功能，该功能基于自研的深度学习模型研发。腾讯和百度等公司也相继接入类似的服务。

2025年2月23日14时作者老刘说NLP

DeepSeek R1 在 think 过程中的需求和问题引起了广泛关注，包括输出思考过程的需求、过长或过短的思考时间以及控制思考方向。文章探讨了这些问题，并提出了通过调整模型设置、修改prompt模板和干预token解码采样的方法来解决。

2025年2月21日8时作者 NLP工程化

OpenAI发布了推理模型的最佳实践，包括何时使用这些模型（如模糊任务、大海捞针）、如何有效利用以及一些基本原则和技巧。

2025年2月18日23时作者乌鸦智能说

马斯克试水20万卡GPU训练的Grok3表现强于现有多数模型，在Math、Science和Coding任务上优于DeepSeek-V3和GPT4o等模型，但与Colossus相比参数量仍不足，预训练规模限制了其性能提升。

2025年2月17日23时作者 Founder Park

R1 发布后，国内外多个云平台迅速部署，并邀请火山引擎专家分享 R1 使用经验。主要讨论企业如何使用推理模型、接入策略及未来方向。