40位数学家组成8队与o4-mini-medium比赛,6队败北
在FrontierMath基准测试中,O4-mini-medium击败了由数学专家组成的团队。尽管AI尚未达到超人水平,但有观点认为它很快就会超越人类。
在FrontierMath基准测试中,O4-mini-medium击败了由数学专家组成的团队。尽管AI尚未达到超人水平,但有观点认为它很快就会超越人类。
第七届北京智源大会将于2025年6月6日至7日在中关村国家自主创新示范区展示中心举行,汇聚图灵奖得主和全球顶尖研究者,探讨人工智能基础理论、应用探索、产业创新和可持续发展等议题。
华为团队发布了三项重要的昇腾推理技术,包括AMLA、融合算子技术和SMTurbo。这些技术通过优化关键算子提升了大模型的推理速度和能效,如AMLA实现了高达71%的算力利用率;融合算子技术让计算与通信无缝协奏;SMTurbo显著降低了跨卡访问延迟至亚微秒级。
大语言模型通过InstructRAG方案结合指令图、强化学习和元学习实现任务规划的可扩展性和迁移性,提升19.2%性能,在多个数据集上表现优于现有方法。
国防科大、深圳大学、武汉大学团队提出PIN-WM世界模型,可以从少量任务无关交互轨迹中识别刚体物理属性,并结合PADC提高策略学习鲁棒性。实验验证其在非抓取操作中的有效性。