LLM
AI浏览器操控革命!MCP-Playwright:AI自动化神器,可执行JS代码进行复杂交互任务!
通过MCP-Playwright协议,大语言模型如Claude能够直接控制浏览器进行网页交互、数据抓取等任务。它支持点击按钮、填写表单、执行JavaScript代码等功能,并提供截屏和分析页面的能力。
用AI绘画的思路做语言大模型:Mercury
Mercury是inception公司推出的一个采用扩散模型逻辑的大语言模型,声称比传统LLM快5-10倍且价格更便宜。它能在几秒钟内迅速给出答案,但答案仍存在不少不明字符和错误。
陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现
陶哲轩分享了使用AI(o3-mini)辅助证明数学难题的故事,包括成功解决了Ruzsa-Szemeredi的三角形移除引理,但当面对研究级别的问题时表现不佳。他指出,大模型在快速提供标准论证细节方面是优秀的用例,但仍需用户详细引导和验证答案的准确性。
让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek
CMU华人团队提出批判性微调(CFT)方法,在仅使用50K样本训练后,显著提升大模型在数学等复杂任务中的表现。相比传统SFT方法,CFT让模型学会批判学习,提高推理能力及适应性。
南京AI放大招:Agent平台支持100+智能体,跨系统调用成功率99.2%
国内开发的通用AI Agent产品Manus引发热议,Agent作为大模型应用落地的重要途径成为行业共识。江苏汇智智能推出基于LLM的生成式AI应用创新引擎BuffGPT,支持工作流应用构建、多智能体编排等能力,助力企业高效打造最优落地效果的AI应用。