学术归档 - 第77页共283页

CVPR 25 全面提升视觉感知鲁棒性，生成模型快速赋能三维检测

2025年5月23日16时作者机器之心

院，导师为李镇老师。目前实验室的研究方向包括：自动驾驶、医学成像和分子理解的多模态数据分析和生成等。

2025年5月23日16时作者机器之心

第七届北京智源大会将于2025年6月6日至7日在中关村国家自主创新示范区展示中心举行，汇聚图灵奖得主和全球顶尖研究者，探讨人工智能基础理论、应用探索、产业创新和可持续发展等议题。

2025年5月23日16时作者机器之心

华为团队发布了三项重要的昇腾推理技术，包括AMLA、融合算子技术和SMTurbo。这些技术通过优化关键算子提升了大模型的推理速度和能效，如AMLA实现了高达71%的算力利用率；融合算子技术让计算与通信无缝协奏；SMTurbo显著降低了跨卡访问延迟至亚微秒级。

2025年5月23日16时作者机器之心

大语言模型通过InstructRAG方案结合指令图、强化学习和元学习实现任务规划的可扩展性和迁移性，提升19.2%性能，在多个数据集上表现优于现有方法。

MLNLP社区是国内外知名的人工智能社区，致力于推动自然语言处理和机器学习领域的交流合作。YSSNLP2025将于2025年6月13-16日在大连召开，会议主题为‘大模型拓界语言智能新境，连青年共筑学术创新生态’。

2025年5月23日11时作者机器之心

国防科大、深圳大学、武汉大学团队提出PIN-WM世界模型，可以从少量任务无关交互轨迹中识别刚体物理属性，并结合PADC提高策略学习鲁棒性。实验验证其在非抓取操作中的有效性。

2025年5月23日11时作者机器之心

PT-5、DeepSeek V4，但今天起，大模型竞争已经进入了全新阶段。
北京时间周五凌晨，知名

2025年5月22日23时作者机器之心

OpenAI的GPT-4o展示了顶级图像理解与生成能力。BLIP3-o采用自回归+扩散框架，研究者对比了三种设计选择，并最终选择了CLIP + Flow Matching方案和顺序训练策略构建BLIP3-o模型。

2025年5月22日23时作者机器之心

论文提出MMaDA，首个系统性探索扩散架构的多模态基础模型，实现文本推理、多模态理解与图像生成的统一建模。该模型在多任务协同上表现出色，并通过混合长链思维微调和统一策略梯度优化提升性能。

2025年5月22日23时作者机器之心

该工作由字节跳动 ByteBrain 团队 × 清华大学合作完成。提出了 ChatTS，一种原生支持多变量时序问答与推理的多模态 LLM，并入选数据库顶级会议 VLDB 2025。