草稿链代替思维链,推理token砍掉80%,显著降低算力成本和延迟
量子位报道:Zoom团队提出新方法‘草稿链’显著降低推理任务的延迟和成本,同时保持高准确率。通过为每个推理步骤生成简洁的中间结果,节省80%-90%的token使用量,并有望帮助企业每月节约数干美元成本。相关代码已开源。
量子位报道:Zoom团队提出新方法‘草稿链’显著降低推理任务的延迟和成本,同时保持高准确率。通过为每个推理步骤生成简洁的中间结果,节省80%-90%的token使用量,并有望帮助企业每月节约数干美元成本。相关代码已开源。
OpenAI发布模型‘身份卡’帮助开发者选择合适的模型。同时,个人用户通过博主总结的表格便于了解不同等级用户的可用量和功能差异。
智能体赛道火爆,Manus产品发布后迅速开源复现。OWL项目来自CAMEL-AI团队,在GAIA基准测试中表现优异。Manus火到国外通过赠送邀请码获取用户,吸引大量试用者和付费用户。GAIA成为评估智能体能力的新标准。
西湖大学张驰团队推出AppAgentX,一款具备自我进化能力的GUI代理。通过自动归纳高效操作模式和视觉操作,提高任务执行效率,并在多个GUI交互任务上展现显著“降本增效”。
第五届对抗机器学习Workshop将在2025年6月的CVPR会议上举行,主题为’基础模型+X’。研讨会旨在探讨基础模型及其特定领域应用中的鲁棒性挑战,并设立最佳论文奖等奖项吸引投稿。
国内开发的通用AI Agent产品Manus引发热议,Agent作为大模型应用落地的重要途径成为行业共识。江苏汇智智能推出基于LLM的生成式AI应用创新引擎BuffGPT,支持工作流应用构建、多智能体编排等能力,助力企业高效打造最优落地效果的AI应用。
两位谷歌DeepMind科学家宣布成立新公司Reflection AI,专注于构建超级智能自主系统。该公司已筹集1.3亿美元资金,并获得多位知名投资者支持。团队成员包括Misha Laskin和Ioannis Antonoglou等前谷歌和OpenAI员工。
DeepSeek等大模型接入声网对话式AI引擎仅需两行代码,每分钟成本不到一毛钱。声网通过统一API接口实现RTC与大模型解耦,助力生成式AI行业变革。