多模态归档 - 第2页共11页

以玩促学？游戏代码驱动数据合成，提升多模态大模型通用推理

2025年7月4日23时作者机器之心

旦
NLP
实验室联合字节跳动智能服务团队的最新研究给出了一个令人意外的发现：
游戏不仅是娱乐工具，

2025年7月4日8时作者量子位

模型上手机”
成为产业落地的焦点。
现有MLLM在手机端部署时常面临两大难题：
1、纯语言任务性能下

2025年7月3日23时作者 PaperWeekly

统一轨迹和交通状态预测任务的新范式。
本文第一作者为北京航空航天大学计算机学院博士生于勰，本文的通讯

2025年7月2日11时作者机器之心

本文综述了通用视觉模型的研究进展，涵盖统一处理多模态输入、多任务学习能力等内容，并对未来研究方向进行了展望。

2025年6月30日16时作者 Founder Park

百度正式开源文心大模型4.5系列，涵盖多种参数规模的混合专家（MoE）和稠密参数模型。该系列预训练权重和推理代码已完全开源，并在多平台可下载部署使用。文心4.5在多个文本和多模态基准测试中达到SOTA水平，支持学术研究和产业应用。

2025年6月29日16时作者 APPSO

Meta 今日从 OpenAI 招来了四名研究员，助力其超级智能计划。这些研究员来自清华大学、中国科学技术大学等顶尖高校，此前在OpenAI负责模型开发及多模态方向的核心工作。

2025年6月28日8时作者智东西

阿里推出多模态统一理解与生成模型Qwen VLo，支持开放指令编辑修改图片，多语言指令，并引入渐进式生成机制提升生成效率和控制力。

2025年6月27日23时作者硅星人Pro

智谱被OpenAI视为与中国在AI领域前沿竞争的重要对手。OpenAI特别提到了智谱在全球化版图中的布局和具体动作，并认为其商业模式和全球影响力与OpenAI存在竞争关系。

2025年6月26日23时作者乌鸦智能说

工程。人工智能，已不再是“试水项目”，而是几乎所有企业的战略重点。
这也催生了AI应用的黄金窗口——