多模态交互归档 - 第2页共3页

小米新生态总监董红光开启创业，要为AI硬件打造智能体 | 智涌独家

2025年2月10日19时作者智能涌现

AI硬件创业热潮下，董红光计划开发搭载在智能玩具、眼镜和耳机等硬件上的软件。当前这些AI硬件仍处于早期阶段，存在软件生态需求缺口。

2025年2月4日8时作者 AIGC开放社区

专注于AIGC领域的专业社区分享了OpenAI联合创始人Sam Altman在东京大学活动中的信息。Altman表示GPT-5将是一个超级混合模型，并且计划整合GPT和o系列模型的支持多模态交互。Altman还提到了多模态能力及潜在的功能增强，如更先进的推理机制和降低AI成本以推动教育应用的策略。

2025年1月27日16时作者多知

伦敦BETT展上亮相的罗博A10学练机融合AI、笔迹识别等技术，旨在实现纸笔学习与数字化的无缝衔接，在教育场景中提供个性化学习方案和智能答疑等功能。

2025年1月23日8时作者开源星探

2024年推出的中文友好的AI编程IDE Trae发布，支持实时建议、代码片段生成等功能，内置Claude-3.5-Sonnet免费聊天模型，简化了项目开发和日常编码过程，特别适合英语非母语开发者。

2025年1月20日23时作者机器之心

机器之心原创
机器之心编辑部
一旦按下通话键，我们就很难再放下手机了。
大年底的，豆包又轰动了一把。

2025年1月12日8时作者 NLP工程化

论文探讨了Agent AI的全面框架，定义其为能够感知视觉和语言输入并产生具身行为的交互式系统。该框架强调跨现实性、多模态方式以及认知能力，未来可应用于虚拟现实和各类软件产品中。

2025年1月9日16时作者 PaperWeekly

近年来，多模态大语言模型（MLLMs）主要聚焦在视觉和文本模态的融合上，对语音的关注较少。然而，语音