刚刚!腾讯正式推出混元-T1:业界首个Transformer-Mamba 推理大模型
腾讯正式推出推理模型混元-T1,基于TurboS基座打造,具备强大的长文理解和加速能力。通过强化学习和大规模训练,T1能有效提升推理性能,并且在多个基准测试中表现优异。
腾讯正式推出推理模型混元-T1,基于TurboS基座打造,具备强大的长文理解和加速能力。通过强化学习和大规模训练,T1能有效提升推理性能,并且在多个基准测试中表现优异。
OpenAI上线o1-pro模型API,其输入价格为150美元/100万输入/输出token,输出价格为600美元。相比R1贵270倍,引起网友争议。
百度发布新款推理AI模型Ernie 4.5,免费向用户开放。该模型在文本生成方面优于GPT-4.5,并已在云收入增长和收购YY直播平台交易中得到体现。
2025年3月17日的文章介绍了RAG相关进展的三方面内容:推理模型在机器翻译中的应用、量化文本分块的有效性方法,以及通过引入层级结构解决局部信息与全局信息间的差距问题。
巴克莱指出,AI行业正经历一场“巨变”,模型从大模型转向推理模型和Agent。预训练缩放可能停滞,看好科技巨头并在用户多、能获益的应用类股票上布局。
阿里开源新一代32亿参数推理模型QwQ-32B,其性能比肩6710亿参数的DeepSeek-R1。QwQ-32B在数学推理、代码生成及通用任务处理能力上实现显著突破,并预示着「最强模型」走进个人设备时代。『算了么』平台提供一键部署方案,让普通人能轻松体验高性能大模型,降低使用门槛。
北大团队发现一段提示词可以让大模型陷入无限思考,并且这种现象可以传递和复制。研究显示乱码问题更容易引发模型的“stuck”机制,说明模型有一定程度的防御措施,但面对具有含义的正常文本时仍需加强。