推理模型归档 - 第4页共8页

刚刚！腾讯正式推出混元-T1：业界首个Transformer-Mamba 推理大模型

2025年3月22日16时作者 AI寒武纪

腾讯正式推出推理模型混元-T1，基于TurboS基座打造，具备强大的长文理解和加速能力。通过强化学习和大规模训练，T1能有效提升推理性能，并且在多个基准测试中表现优异。

2025年3月20日16时作者量子位

OpenAI上线o1-pro模型API，其输入价格为150美元/100万输入/输出token，输出价格为600美元。相比R1贵270倍，引起网友争议。

2025年3月16日23时作者 Z Potentials

百度发布新款推理AI模型Ernie 4.5，免费向用户开放。该模型在文本生成方面优于GPT-4.5，并已在云收入增长和收购YY直播平台交易中得到体现。

2025年3月16日23时作者新智元

iLoCo被证明更好、更快、更强，可在多个数据中心训练越来越大的LLM。
测试时计算之后，谷歌三大团

2025年3月16日19时作者老刘说NLP

2025年3月17日的文章介绍了RAG相关进展的三方面内容：推理模型在机器翻译中的应用、量化文本分块的有效性方法，以及通过引入层级结构解决局部信息与全局信息间的差距问题。

2025年3月7日23时作者机器之心

阿里开源新一代32亿参数推理模型QwQ-32B，其性能比肩6710亿参数的DeepSeek-R1。QwQ-32B在数学推理、代码生成及通用任务处理能力上实现显著突破，并预示着「最强模型」走进个人设备时代。『算了么』平台提供一键部署方案，让普通人能轻松体验高性能大模型，降低使用门槛。

2025年2月28日16时作者量子位

北大团队发现一段提示词可以让大模型陷入无限思考，并且这种现象可以传递和复制。研究显示乱码问题更容易引发模型的“stuck”机制，说明模型有一定程度的防御措施，但面对具有含义的正常文本时仍需加强。