速递|8秒视频只是起点,谷歌Veo 2携8秒720P视频登陆Gemini,硬刚OpenAI Sora
谷歌即将在其Gemini平台上推出新的Veo 2视频生成AI模型,该模型目前仅限于订阅Gemini Advanced的付费用户使用。Gemini Advanced用户可创建720p分辨率8秒的16:9宽高比视频,并通过Gemini的分享按钮上传至TikTok、YouTube等平台。
谷歌即将在其Gemini平台上推出新的Veo 2视频生成AI模型,该模型目前仅限于订阅Gemini Advanced的付费用户使用。Gemini Advanced用户可创建720p分辨率8秒的16:9宽高比视频,并通过Gemini的分享按钮上传至TikTok、YouTube等平台。
谷歌最先进的视频生成模型Veo 2能将文本、图像或两者结合转化为八秒的视频,它擅长理解简单和复杂指令,并准确模拟现实世界的物理规律。开发者可以通过Google AI Studio、Gemini API等平台使用Veo 2的核心功能包括文本到视频和图像到视频。同时介绍Python工具Zev用于自然语言查询终端命令、VS Code扩展RooFlow增强AI辅助开发、实时会议转录APIVexa支持多种平台并提供企业级安全保障的工具automcp。
谷歌DeepMind发布的新模型Veo 2可以在用户提示下生成最高8秒720P电影级视频,已超过多个同类应用。API可免费使用,目前支持图片转视频和多种场景视频生成。
谷歌发布了视频生成模型Veo 2,声称其可以更好地理解现实世界及人类运动表达的细微差别。Veo 2能生成分辨率高达4K(4096 x 2160像素),时长为2分钟的视频片段。
OpenAI公布GPT Search更新后,谷歌推出4K版Veo 2。其支持生成4K视频、延长视频时长至几分钟,并具备真实物理交互能力。Veo 2效果惊艳,几乎看不出生成痕迹;Google还通过Meta数据集进行评测。此外,Imagen3和Whisk等新工具展示了AI在多模态领域的创新。
Google发布了AI视频模型Veo 2和改进版的AI绘图模型Imagen 3。Veo 2在OpenAI发布个性化的AI搜索后,展示了极高的物理效果和稳定的运动质量,并通过Meta发布的基准数据集MovieGenBench进行了测试。Imagen 3则展示了一种更加自然、流畅的人类观察者体验。Google还强调了其模型的稳定性和上限。