速递|​8秒视频只是起点,谷歌Veo 2携8秒720P视频登陆Gemini,硬刚OpenAI Sora

谷歌即将在其Gemini平台上推出新的Veo 2视频生成AI模型,该模型目前仅限于订阅Gemini Advanced的付费用户使用。Gemini Advanced用户可创建720p分辨率8秒的16:9宽高比视频,并通过Gemini的分享按钮上传至TikTok、YouTube等平台。

谷歌最先进的视频生成模型Veo 2,使用自然语言查询终端命令,将多种Agent框架转换为MCP服务器工具

谷歌最先进的视频生成模型Veo 2能将文本、图像或两者结合转化为八秒的视频,它擅长理解简单和复杂指令,并准确模拟现实世界的物理规律。开发者可以通过Google AI Studio、Gemini API等平台使用Veo 2的核心功能包括文本到视频和图像到视频。同时介绍Python工具Zev用于自然语言查询终端命令、VS Code扩展RooFlow增强AI辅助开发、实时会议转录APIVexa支持多种平台并提供企业级安全保障的工具automcp。

谷歌版 4k Sora上手效果分享,它可太懂物理世界和人物运动了!

OpenAI公布GPT Search更新后,谷歌推出4K版Veo 2。其支持生成4K视频、延长视频时长至几分钟,并具备真实物理交互能力。Veo 2效果惊艳,几乎看不出生成痕迹;Google还通过Meta数据集进行评测。此外,Imagen3和Whisk等新工具展示了AI在多模态领域的创新。

Google全新发布AI视频Veo2、AI绘图Imagen3 – 何以凌越。

Google发布了AI视频模型Veo 2和改进版的AI绘图模型Imagen 3。Veo 2在OpenAI发布个性化的AI搜索后,展示了极高的物理效果和稳定的运动质量,并通过Meta发布的基准数据集MovieGenBench进行了测试。Imagen 3则展示了一种更加自然、流畅的人类观察者体验。Google还强调了其模型的稳定性和上限。