用AI绘画的思路做语言大模型:Mercury
Mercury是inception公司推出的一个采用扩散模型逻辑的大语言模型,声称比传统LLM快5-10倍且价格更便宜。它能在几秒钟内迅速给出答案,但答案仍存在不少不明字符和错误。
Mercury是inception公司推出的一个采用扩散模型逻辑的大语言模型,声称比传统LLM快5-10倍且价格更便宜。它能在几秒钟内迅速给出答案,但答案仍存在不少不明字符和错误。
陶哲轩分享了使用AI(o3-mini)辅助证明数学难题的故事,包括成功解决了Ruzsa-Szemeredi的三角形移除引理,但当面对研究级别的问题时表现不佳。他指出,大模型在快速提供标准论证细节方面是优秀的用例,但仍需用户详细引导和验证答案的准确性。
CMU华人团队提出批判性微调(CFT)方法,在仅使用50K样本训练后,显著提升大模型在数学等复杂任务中的表现。相比传统SFT方法,CFT让模型学会批判学习,提高推理能力及适应性。
国内开发的通用AI Agent产品Manus引发热议,Agent作为大模型应用落地的重要途径成为行业共识。江苏汇智智能推出基于LLM的生成式AI应用创新引擎BuffGPT,支持工作流应用构建、多智能体编排等能力,助力企业高效打造最优落地效果的AI应用。
在2025年3月7日的周五,文章探讨了AI内容的影响范围及R1复现基座的一些解释,并介绍了多模态语音大模型在R1方面的尝试。