华为版《黑客帝国》首次亮相:训推复杂AI前先“彩排”,小时级预演万卡集群

华为首次展示了其‘数字化风洞’技术,通过虚拟环境平台在电脑中预演复杂AI模型的训练和推理过程,以避免算力浪费。该技术包括Sim2Train用于优化训练阶段配置、Sim2Infer提升推理性能至30%以及Sim2Availability确保大模型高可用性。

智能体自己出现问题自己找!首次提出“自动化失败归因”课题 ICML2025 Spotlight

本文介绍了一项新研究,首次提出并定义了’自动化失败归因’这一全新课题。研究人员构建了首个专用基准数据集Who&When,并开发评估了多种自动化归因方法,揭示了Multi-Agent系统中找到责任Agent和错误步骤的复杂性,为提升LLM Multi-Agent系统的可靠性和智能开辟了新的道路。

北大伯克利联手“拷问”大模型:最强Agent也才40分!新基准专治“不听话”的AI分析师

北大邓小铁课题组发布的新基准IDA-Bench模拟真实数据分析场景,测试了大模型在多轮交互中的表现。结果显示即使是顶尖模型,其成功率也仅约40%,揭示了现有模型在理解和遵循指令方面存在的问题。

全球人工智能创新创业大赛即将启幕!杭州拱墅全力打造AI创新高地

2025年6月,杭州市拱墅区将举办“智汇运河·智算未来”全球人工智能创新创业大赛,聚焦智能制造、智慧城市等四大主题赛道,旨在推动顶尖技术与产业资源汇聚杭州拱墅,助力打造具有国际影响力的人工智能创新应用示范区。