ICLR 2025 英伟达提出FP8训练新范式:减少40%显存占用,训练加速1.43倍
近期伯克利等机构提出COAT方法,通过动态范围扩展和混合粒度FP8精度流技术,在保持模型精度的同时显著减少FP8量化误差及激活值占用,实现了端到端内存占用减少1.54倍、训练速度提高1.43倍。
近期伯克利等机构提出COAT方法,通过动态范围扩展和混合粒度FP8精度流技术,在保持模型精度的同时显著减少FP8量化误差及激活值占用,实现了端到端内存占用减少1.54倍、训练速度提高1.43倍。
Monica团队发布全球首款通用Agent产品Manus,引起热议。Manus能帮助用户进行全面分析、生成报告等任务,表现远超OpenAI的Deep Search。开发者称其实现了从目标设定到成果交付的全链路自主执行,接近人类专家水平。
MIT 研究人员提出一种使用Transformer解决Empirical Bayes(mean estimation)任务的方法,并发现Transformer在该任务上的性能优于经典方法,且运行速度更快。
加拿大魁北克省人工智能研究所Mila、美国东北大学和MIT的研究者将在AAAI会议上组织一场关于人工智能在蛋白质设计中的应用的教程,涵盖最新进展与未来趋势。
新基准ENIGMAEVAL对高难度问题提出挑战,显示主流推理模型在面对复杂谜题时准确率极低。研究者使用原始多模态谜题进行评估,发现前沿语言模型即使在普通谜题中表现也仅7.0%,且难以解决困难谜题。
麻省理工学院的研究团队开发了一款仅重750毫克的四翼微型飞行器(MAV),实现了长达1000秒的持续悬停飞行,其特技动作如双重空翻的速度和精度远超传统机器人。这款飞行器在Science Robotics上发表,展示了仿生设计与工程创新的结合,未来有望应用于授粉、侦察等领域。
MIT教授RosalindW.Picard在NeurIPS大会上的演讲中提到中国学生的国籍,引发了争议。一位中国学生指出这一做法可能带有偏见,并建议删除提及国籍的描述。随后,Picard教授发表道歉声明,承认自己的言论不恰当,表示会采纳建议删掉相关国籍标注。