阿里通义实验室归档

WebAgent 是阿里通义实验室开发的开放多智能体信息检索框架

2025年7月8日8时作者 NLP工程化

WebAgent 是阿里通义实验室开发的多智能体信息检索框架，整合了 WebWalker、WebDancer 和 WebSailor 三个子项目，实现了超人类水平的信息推理和自主搜索能力，并在多个基准上超越现有系统。

2025年3月17日8时作者开源星探

阿里通义实验室薄列峰团队首次将RLVR应用于全模态LLM，聚焦情感识别任务。R1-Omni模型提升了推理、理解与泛化能力，在多模态数据集上表现出色，并已开源。

2025年3月12日14时作者小兵的AI视界

阿里通义实验室开源的R1-Omni模型首次将强化学习与可验证奖励（RLVR）技术应用于全模态情感识别任务，提升推理能力和泛化能力。该模型通过透明展示各个模态信息的作用和多模态融合增强了性能，并在多个数据集上显著优于其他模型。

2025年3月11日16时作者量子位

阿里通义实验室薄列峰团队首次将RLVR应用于包含音频、动态视觉内容的全模态LLM，聚焦情感识别任务。研究发现模型在分布内和分布外数据集上均有显著提升，并能清晰分析不同模态的作用，目前这些模型已开源。

2025年1月31日16时作者量子位

UIUC与阿里通义实验室联合推出Mobile-Agent-E，这是一种新型手机智能体框架。它利用多层级多智能体架构来处理复杂的真实场景任务，并引入自我进化模块以增强其学习能力。

2025年1月21日8时作者开源星探

浙大与阿里联合推出OmniThink深度AI写作系统，模拟人类学习过程解决AI写作内容浅显、重复和非原创性问题。支持多种底座模型，通过迭代扩展知识边界提升生成内容质量，适用于媒体出版、学术研究等场景。

2024年12月4日15时作者量子位

阿里通义实验室推出OmniSearch多模态检索智能体，通过动态规划提高检索效率和生成内容准确性。OmniSearch能根据问题情境动态调整检索策略，显著优于传统方法，尤其在需要多步推理、多模态知识和快速变化答案的问题上表现优异。