LLM 归档 - 第11页共18页

医学可用！推理增强RAG：精准诊断、智能补问、高效解析 WWW 2025

2025年3月14日16时作者新智元

识图谱推理增强大语言模型（LLM）的诊断能力，显著提升智能健康助手的诊断精度和个性化建议水平。Med

2025年3月14日8时作者开源星探

通过MCP-Playwright协议，大语言模型如Claude能够直接控制浏览器进行网页交互、数据抓取等任务。它支持点击按钮、填写表单、执行JavaScript代码等功能，并提供截屏和分析页面的能力。

2025年3月12日12时作者路过银河AI

Mercury是inception公司推出的一个采用扩散模型逻辑的大语言模型，声称比传统LLM快5-10倍且价格更便宜。它能在几秒钟内迅速给出答案，但答案仍存在不少不明字符和错误。

2025年3月11日16时作者新智元

陶哲轩分享了使用AI（o3-mini）辅助证明数学难题的故事，包括成功解决了Ruzsa-Szemeredi的三角形移除引理，但当面对研究级别的问题时表现不佳。他指出，大模型在快速提供标准论证细节方面是优秀的用例，但仍需用户详细引导和验证答案的准确性。

2025年3月10日23时作者 APPSO

Manus 联合创始人回应用户越狱事件，称这是设计的一部分。沙盒机制保证了用户的访问不会破坏系统安全。

2025年3月10日16时作者新智元

务，适用于数字和物理环境：通过标记集合（SoM）和标记轨迹（ToM）技术，将视觉语言数据转化为可操作

2025年3月9日12时作者新智元

CMU华人团队提出批判性微调(CFT)方法，在仅使用50K样本训练后，显著提升大模型在数学等复杂任务中的表现。相比传统SFT方法，CFT让模型学会批判学习，提高推理能力及适应性。

2025年3月8日23时作者新智元

天开始，在X和Reddit上的外国网友中，Manus的讨论声量开始变大了！拿到邀请码的歪果网友实测后

2025年3月8日12时作者量子位

国内开发的通用AI Agent产品Manus引发热议，Agent作为大模型应用落地的重要途径成为行业共识。江苏汇智智能推出基于LLM的生成式AI应用创新引擎BuffGPT，支持工作流应用构建、多智能体编排等能力，助力企业高效打造最优落地效果的AI应用。