机器之心，作者每时AI - 第68页共134页

VBench-2.0：面向视频生成新世代的评测框架

2025年3月28日23时作者机器之心

AI 可以生成如此逼真的视频，一时间各大高校实验室、互联网巨头 AI Lab 以及创业公司纷纷入局视

2025年3月28日23时作者机器之心

被输入进来，又被输出出去。没有人知道 AI 为什么会这样做。
刚刚，AI 公司 Anthropic

2025年3月28日23时作者机器之心

，上个月的开源周更是毫无保留地将自己的多项核心技术开放给了全球开发者。这种「完整技术栈」式的开源震撼

2025年3月28日11时作者机器之心

OpenAI 的 GPT-4o 图像生成功能上线不到 2 天就受到了服务器压力，尽管付费用户仍可使用该功能，但免费用户可能面临更多限制。

2025年3月28日11时作者机器之心

VGGT 是一种基于纯前馈 Transformer 架构的通用 3D 视觉模型，能在单张或多张图像中直接预测相机参数、深度图和点云等几何信息。其推理速度可达秒级，并在多个任务中超越传统方法。

2025年3月27日16时作者机器之心

I，抢在 OpenAI 开直播之前，谷歌上线了最强大的推理模型 Gemini 2.5 Pro。
谷歌

2025年3月27日16时作者机器之心

产大模型在技术实力上，又一次站在了世界前沿。
3 月 26 日，国内「All in AGI 与 AI

2025年3月27日16时作者机器之心

清华大学陈键飞团队提出SpargeAttn，无需训练且对任意模型通用的稀疏Attention，实现推理加速4-7倍。

2025年3月27日16时作者机器之心

阿里发布全新 Qwen2.5-Omni 多模态大模型，支持语音和视频聊天，并开源了7B参数的Thinker-Talker架构模型，性能优于单模态模型。

2025年3月27日16时作者机器之心

）AI 中心汪军教授，香港科技大学（广州）信息枢纽院长陈雷教授联合指导。第一作者邓程是香港科技大学（