2025年1月24日8时 - 第10页共11页

阶跃多模态团队提出「慢感知」概念：迈向视觉system2 (o1) 的第一步

2025年1月24日8时作者 PaperWeekly

论文提出慢感知概念，通过分解和流动感知几何图形来提高视觉系统2的精细感知能力。研究显示，慢感知能提升模型对几何线段的解析能力，并在多种指标上优于基线方法。

2025年1月24日8时作者 NLP工程化

UI-TARS 是一种智能体模型，可以直接理解并操作图形界面的原生 GUI 智能体，它具有感知、行动、推理和记忆等关键能力。相比传统拼装方法，UI-TARS 使用一个“大模型”进行端到端学习，提升了灵活性与稳健性，并在某些测试上超过了 Claude 和 GPT-4。

2025年1月24日8时作者新智元

新智元报道
编辑：英智
【新智元导读】
AI智能体正悄然成为我们工作和生活中的得力助手。从自动化任务

2025年1月24日8时作者 PaperWeekly

随着语言大模型的成功，视觉 – 语言多模态大模型 (Vision-Language Multimod

2025年1月24日8时作者开源星探

一款多功能AI内容创作工具AI-ContentCraft整合了写作、配音和绘图功能，支持中英文创作。它能自动生成高质量的文字内容，并提供与文字相符的语音及图像呈现，有效提升创作者的工作效率。

2025年1月24日8时作者新智元

OpenAI开发的高级AI编码助手旨在媲美L6级软件工程师，有望提升企业开发效率并重塑软件行业。该智能体能处理代码重构、优化数据跟踪，并集成个性化功能。

2025年1月24日8时作者机器之心

机器之心报道
编辑：杜伟、Panda
大概北京时间昨天下午五点左右，继上次的
星际之门项目
之后，O

2025年1月24日8时作者钛媒体AGI

OpenAI发布新功能Operator，能自动化复杂任务如餐厅预订和旅行规划，适用于美国Pro专业用户；同时免费版与Plus版ChatGPT获额外资源。

2025年1月24日8时作者 AIGC开放社区

专注AIGC领域，近期OpenAI发布了面向浏览器的智能体Operator，无需依赖API就能完成各种自动化任务。