日期: 2025 年 4 月 21 日
UIUC联手谷歌发布Search-R1:大模型学会「边想边查」,推理、搜索无缝切换
本文介绍了一种新的强化学习框架Search-R1,用于训练大语言模型以更有效地利用搜索引擎。通过引入可交互的搜索引擎模块,模型能够在生成答案时随时发起搜索请求,从而提升推理质量。
Sebastian Raschka长文:DeepSeek-R1、o3背后,RL推理训练正悄悄突破上限
了?大语言模型(LLM)推理需要强化学习(RL)来「加 buff」。
著名 AI 研究者和博主 Se
ACM MM 2025 LGM3A研讨会征稿:探索大模型与多模态的融合创新
我们诚挚邀请您提交论文参加ACM Multimedia 2025大会期间的LGM3A Workshop,该研讨会聚焦于大型生成模型在多模态应用中的潜力。
Cursor最新版详解:MCP图片上下文、自动生成项目规则等实用功能!
Cursor 0.49 版本发布,新增智能规则生成、聊天历史访问优化、代码审查改进等新功能。支持图片上下文传递及终端控制增强,全局忽略文件和多模型支持升级。
扣子空间体验-带你看没有繁琐配置的MCP有多强大!
通过简单介绍扣子空间的基本使用方法和三个案例展示了其强大功能。该工具支持调用内置MCP服务完成复杂任务,如生成PPT、网页等,并且可以直接调用飞书文档内容。
我说:「给你 20 美金小费」,AI 掏出了收款码…
蚂蚁‘百宝箱’支持MCP后,AI模型能主动发起交易并进行付款。开发者可以通过MCP插件市场调用支付宝、高德等服务。尽管这是沙盒测试版,但模拟了AI在真实世界中的交互流程,使智能体能够完成从请求到执行的完整链路,标志着其成为‘世界的参与者’。