量子位，作者每时AI - 第105页共151页

DeepSeek、OpenAI、Kimi视觉推理到底哪家强？港中文MMLab推出推理基准MME-COT

2025年2月22日23时作者量子位

（Chain-of-Thought, CoT）展示了超强的推理能力，但这一能力能多大程度地帮助视觉推

2025年2月22日8时作者量子位

k正在重塑全球AI竞争格局。
微信、飞书、百度等上百家企业一个赛一个地宣布接入DeepSeek，表面

2025年2月22日8时作者量子位

由单张图像拓展至多图像应用场景。
比如，在复杂的相册中自动识别出Luigi并在第二张图中找到他，或

2025年2月22日8时作者量子位

Grok-3发布仅三天便陷入作弊风波。OpenAI指责其使用cons@64评估模型，导致其表现被高估。尽管如此，Grok-3仍展示了其独特的能力和潜力，如快速开发小游戏等。

2025年2月22日8时作者量子位

了？！
这是来自香港大学黄超教授实验室发布的最新研究成果——
VideoRAG
。
具体而言，Vid

2025年2月22日8时作者量子位

在，居然才刚刚1个月整？！
这场春节暴击的余波未平，就在今天，国内大模型六小强之一的
阶跃星辰
，用

2025年2月21日16时作者量子位

腾讯AI助手‘腾讯元宝’新增功能，接入DeepSeek能理解图片信息。通过深度思考模式，元宝可以识别并解读图片内容，并结合图片内容给出分析和理解。

2025年2月21日8时作者量子位

Figure发布首个成果Helix，一个端到端通用控制模型。只需自然语言提示，机器人就能拿起任何东西。它展示了强大的对象泛化能力，在未见过的物体上执行任务的能力。

2025年2月21日8时作者量子位

Sitcom-Crafter提出了一种基于场景感知的多人交互运动生成方法，能够自动生成符合逻辑的3D角色动画。该技术解决了现有自动化方案难以满足复杂剧情需求的问题，并且采用了数据规范化策略和多模块协同设计，提高了创作效率和动作质量。

2025年2月20日23时作者量子位

复旦团队发表综述论文《A Survey on Video Diffusion Models》，系统梳理扩散模型在视频生成、编辑及理解领域的进展，涵盖300+文献。