复杂任务归档 - 第2页共5页

Seed1.5-VL：一款强大的视觉-语言基础模型

2025年5月14日8时作者 NLP工程化

Seed1.5-VL是专为通用多模态理解和推理设计的视觉-语言基础模型，仅用5.32亿视觉编码器和200亿参数的MoE LLM实现顶尖性能，在60个公共基准测试中有38项达到最佳水平。

2025年5月12日23时作者 APPSO

有时候你想让它大胆一点，它反倒一秒变怂，句句开头都是「对不起，我不能……」
表面上看，是 AI 太保

2025年5月6日16时作者新智元

新智元报道
具身智能公司Physical Intelligence推出π0.5 VLA模型，通过异构任务协同训练实现广泛泛化能力，机器人能在多种环境中完成复杂任务。

2025年5月3日16时作者 AI前线

earch（深度研究）。这是一款集成于 ChatGPT 的 AI 研究助手，旨在帮助用户高效地完成复

2025年4月26日16时作者机器之心

多关注数学、代码等专业领域。如何将这种深度推理模型扩展到智能体和具身领域，让机器人通过思考和推理来完

2025年4月22日14时作者 AI先锋官

字节跳动新推出Agent产品“扣子空间”，支持无线裂变邀请码获取。用户可通过探索和规划模式生成网页、网页版吉他、天气预报网站等任务，并添加MCP扩展插件。目前处于内测阶段，存在一些小问题，但任务拆解与多模态输出超越多数竞品。

2025年4月18日16时作者新智元

OpenAI的o3模型在门萨智商测试中得分高达136，能够识别照片拍摄位置并进行复杂图像分析。尽管存在一些视觉推理问题上的不稳定性，但其强大的工程能力和顶尖基础性能使其有望解决这些问题。

2025年4月9日11时作者新智元

ma Nemotron-253B推理模型，在数学编码、科学问答中准确率登顶，甚至以一半参数媲美Dee

2025年4月4日16时作者机器之心

把复杂问题交给大模型。它们通常会陷入「深度思考」，有条不紊地展示思维链过程，并最终输出一份近乎完美的