华为版《黑客帝国》首次亮相:训推复杂AI前先“彩排”,小时级预演万卡集群
华为首次展示了其‘数字化风洞’技术,通过虚拟环境平台在电脑中预演复杂AI模型的训练和推理过程,以避免算力浪费。该技术包括Sim2Train用于优化训练阶段配置、Sim2Infer提升推理性能至30%以及Sim2Availability确保大模型高可用性。
华为首次展示了其‘数字化风洞’技术,通过虚拟环境平台在电脑中预演复杂AI模型的训练和推理过程,以避免算力浪费。该技术包括Sim2Train用于优化训练阶段配置、Sim2Infer提升推理性能至30%以及Sim2Availability确保大模型高可用性。
本文介绍了一项新研究,首次提出并定义了’自动化失败归因’这一全新课题。研究人员构建了首个专用基准数据集Who&When,并开发评估了多种自动化归因方法,揭示了Multi-Agent系统中找到责任Agent和错误步骤的复杂性,为提升LLM Multi-Agent系统的可靠性和智能开辟了新的道路。
Meta CEO扎克伯格因Llama 4表现不佳,急召顶尖人才组建新AI实验室,并斥巨资收购初创公司Scale AI的49%股份。新实验室目标为研究“超级智能”,预计规模约50人。
OpenAI发布最强版推理模型o3-pro,并降价80%。o3-pro被证明在数学、科学和编程方面表现出色,已被应用于ChatGPT的Pro和Team用户中。
最新优化版DeepSeek-R1(0528)在编程榜单aider上取得了60%的成绩,超过Claude 4 Sonnet和1月版的满血R1。同时,1.93bit版本R1相比原始版8bit减少了70%以上的文件大小,并且能够在较小的内存条件下运行游戏任务。
美国费米实验室的最新实验结果显示μ子磁矩的反常值与标准模型预测值一致,未发现新的显著偏差。这结束了长久以来关于μ子异常的讨论,证明标准模型仍然有效。
北大邓小铁课题组发布的新基准IDA-Bench模拟真实数据分析场景,测试了大模型在多轮交互中的表现。结果显示即使是顶尖模型,其成功率也仅约40%,揭示了现有模型在理解和遵循指令方面存在的问题。
传统的视频编辑方法存在多个问题,西湖大学AGILab提出FlowDirector新方法。无需反演和训练,实现高质量、准确的视频编辑,开销低且支持多种编辑任务。
香港大学与英伟达联合推出广义空间传播网络(GSPN),通过二维线性传播和稳定性-上下文条件显著降低计算复杂度,提升视觉任务效率,并在多个视觉领域刷新性能纪录。
2025年6月,杭州市拱墅区将举办“智汇运河·智算未来”全球人工智能创新创业大赛,聚焦智能制造、智慧城市等四大主题赛道,旨在推动顶尖技术与产业资源汇聚杭州拱墅,助力打造具有国际影响力的人工智能创新应用示范区。