多模态大模型归档 - 第5页共10页

商汤甩出具身智能大招！最强多模态大模型登场，给机器人装上大脑和眼睛

2025年4月10日23时作者智东西

模型，给人形机器人装上大脑、眼睛、耳朵和嘴巴了！
这位傅利叶通用人形机器人GRx，立即辨认出“水”和

2025年4月8日11时作者机器之心

Q-Insight 提出了一种基于强化学习训练的多模态大模型图像画质理解方案，通过挖掘大模型自身的推理潜力，实现对图像质量的深度理解，并在多个任务上达到业界领先水平。

2025年4月4日16时作者量子位

日常问答中展现出惊人的上下文连贯性，在设计、咨询等需要高度创造力的任务中也大放异彩。
当GPT-4.

2025年4月4日14时作者 AI技术研习社

2025年AIGC（人工智能生成内容）发展趋势及挑战分析。涵盖技术突破、应用场景拓展和市场增长等方面，并指出版权、隐私和伦理等问题。

2025年4月2日16时作者新智元

清华大学等团队提出4D LangSplat方法，结合多模态大模型和状态变化网络，成功重建动态语义场并实现高效精准的开放文本查询任务。该方法在多项评估指标上优于现有技术。

2025年4月1日23时作者智东西

上一句话，机器人就可以为你倒一杯果汁、打一个鸡蛋、将桌子上的碗筷准确放到收纳架上，机器人还可以读懂你

2025年3月28日11时作者机器之心

OpenAI 的 GPT-4o 图像生成功能上线不到 2 天就受到了服务器压力，尽管付费用户仍可使用该功能，但免费用户可能面临更多限制。

2025年3月27日16时作者量子位

大模型——
通义千问Qwen2.5-Omni-7B
，来了。
仅靠一个
一体式模型
，就能搞定文本、

2025年3月27日16时作者机器之心

阿里发布全新 Qwen2.5-Omni 多模态大模型，支持语音和视频聊天，并开源了7B参数的Thinker-Talker架构模型，性能优于单模态模型。