上海AI Lab发布LLM高效Reasoning综述!全面总结如何“少想多做”
MLNLP社区致力于促进机器学习与自然语言处理领域的学术交流与进步。文章介绍了如何解决大型推理模型(LRMs)带来的冗余思考问题,包括字数预算、双系统切换、模型路由等方法,并探讨了未来高效推理的发展方向。
MLNLP社区致力于促进机器学习与自然语言处理领域的学术交流与进步。文章介绍了如何解决大型推理模型(LRMs)带来的冗余思考问题,包括字数预算、双系统切换、模型路由等方法,并探讨了未来高效推理的发展方向。
谷歌发布最强推理模型Gemini 2.5 Pro,在多个测试平台超过GPT-4等知名模型,编程能力显著提升,已面向高级用户提供并计划上线Vertex AI。
腾讯正式推出推理模型混元-T1,基于TurboS基座打造,具备强大的长文理解和加速能力。通过强化学习和大规模训练,T1能有效提升推理性能,并且在多个基准测试中表现优异。
OpenAI上线o1-pro模型API,其输入价格为150美元/100万输入/输出token,输出价格为600美元。相比R1贵270倍,引起网友争议。
百度发布新款推理AI模型Ernie 4.5,免费向用户开放。该模型在文本生成方面优于GPT-4.5,并已在云收入增长和收购YY直播平台交易中得到体现。
2025年3月17日的文章介绍了RAG相关进展的三方面内容:推理模型在机器翻译中的应用、量化文本分块的有效性方法,以及通过引入层级结构解决局部信息与全局信息间的差距问题。
巴克莱指出,AI行业正经历一场“巨变”,模型从大模型转向推理模型和Agent。预训练缩放可能停滞,看好科技巨头并在用户多、能获益的应用类股票上布局。
阿里开源新一代32亿参数推理模型QwQ-32B,其性能比肩6710亿参数的DeepSeek-R1。QwQ-32B在数学推理、代码生成及通用任务处理能力上实现显著突破,并预示着「最强模型」走进个人设备时代。『算了么』平台提供一键部署方案,让普通人能轻松体验高性能大模型,降低使用门槛。