312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7
上海交通大学和SII的研究表明,仅需312条人类标注轨迹,并通过合成更多动作决策的思维链补全与轨迹增强技术,就能显著提升电脑智能体(Operator)性能。这一方法使得模型性能提升了241%,超越了基础模型Claude 3.7 Sonnet extended thinking模式,成为Windows系统上开源电脑智能体的新一代SOTA。
上海交通大学和SII的研究表明,仅需312条人类标注轨迹,并通过合成更多动作决策的思维链补全与轨迹增强技术,就能显著提升电脑智能体(Operator)性能。这一方法使得模型性能提升了241%,超越了基础模型Claude 3.7 Sonnet extended thinking模式,成为Windows系统上开源电脑智能体的新一代SOTA。
深圳市大数据研究院与香港中文大学研究团队发现一种新的算法,通过减少特定矩阵乘法的运算量来节省5%的能量消耗。该成果引起国际专家关注,并对多个实际应用领域带来优化潜力。
第七届北京智源大会将于2025年6月6日至7日在中关村国家自主创新示范区展示中心举行,汇聚全球顶尖研究者分享最新成果。大会将围绕人工智能四大主题展开,包括基础理论、应用探索、产业创新和可持续发展等,设有近20场专题论坛。
第七届北京智源大会将于2025年6月6日至7日在中关村国家自主创新示范区展示中心举行,汇聚图灵奖得主和全球顶尖研究者,探讨人工智能基础理论、应用探索、产业创新和可持续发展等议题。
B 站开源动画视频生成模型 Index-AniSora,支持多种二次元风格视频生成。该工作包括高质量数据集、统一扩散生成框架和评估基准等技术方案。
OpenAI发布全新Codex代码Agent,支持开发人员执行多种任务。Codex由Codex-1模型提供支持,在云端隔离环境中运行预加载用户代码库。该工具能生成符合程序员风格的代码,并明确拒绝恶意软件请求。目前已被多家公司采用加速开发过程。