学术
四位图灵奖掌舵:2025智源大会揭示AI进化新路径
第七届北京智源大会将于2025年6月6日至7日在中关村国家自主创新示范区展示中心举行,汇聚图灵奖得主和全球顶尖研究者,探讨人工智能基础理论、应用探索、产业创新和可持续发展等议题。
以加代乘?华为数学家出手,昇腾算子的高能设计与优化,性能提升30%!
华为团队发布了三项重要的昇腾推理技术,包括AMLA、融合算子技术和SMTurbo。这些技术通过优化关键算子提升了大模型的推理速度和能效,如AMLA实现了高达71%的算力利用率;融合算子技术让计算与通信无缝协奏;SMTurbo显著降低了跨卡访问延迟至亚微秒级。
SIGIR 2025 解决扩展和迁移难题,华为新加坡提出InstructRAG,提升高达19%
大语言模型通过InstructRAG方案结合指令图、强化学习和元学习实现任务规划的可扩展性和迁移性,提升19.2%性能,在多个数据集上表现优于现有方法。
早鸟注册倒计时4天 第二十二届自然语言处理青年学者研讨会 (YSSNLP2025)
MLNLP社区是国内外知名的人工智能社区,致力于推动自然语言处理和机器学习领域的交流合作。YSSNLP2025将于2025年6月13-16日在大连召开,会议主题为‘大模型拓界语言智能新境,连青年共筑学术创新生态’。
RSS 2025|物理驱动的世界模型PIN-WM:直接从视觉观测估计物理属性,可用于操作策略学习
国防科大、深圳大学、武汉大学团队提出PIN-WM世界模型,可以从少量任务无关交互轨迹中识别刚体物理属性,并结合PADC提高策略学习鲁棒性。实验验证其在非抓取操作中的有效性。
自回归+扩散!Salesforce开源统一多模态模型BLIP3-o,图像理解与生成全拿下
OpenAI的GPT-4o展示了顶级图像理解与生成能力。BLIP3-o采用自回归+扩散框架,研究者对比了三种设计选择,并最终选择了CLIP + Flow Matching方案和顺序训练策略构建BLIP3-o模型。
比Gemini Diffusion更全能!首个多模态扩散大语言模型MMaDA发布,同时实现强推理与高可控性
论文提出MMaDA,首个系统性探索扩散架构的多模态基础模型,实现文本推理、多模态理解与图像生成的统一建模。该模型在多任务协同上表现出色,并通过混合长链思维微调和统一策略梯度优化提升性能。
字节跳动&清华大学开源多模态时序大模型ChatTS,可实现时序数据对话与推理
该工作由字节跳动 ByteBrain 团队 × 清华大学合作完成。提出了 ChatTS,一种原生支持多变量时序问答与推理的多模态 LLM,并入选数据库顶级会议 VLDB 2025。