文本到视频归档 - 每时AI

谷歌最先进的视频生成模型Veo 2，使用自然语言查询终端命令，将多种Agent框架转换为MCP服务器工具

2025年4月16日11时作者每日AI新工具

谷歌最先进的视频生成模型Veo 2能将文本、图像或两者结合转化为八秒的视频，它擅长理解简单和复杂指令，并准确模拟现实世界的物理规律。开发者可以通过Google AI Studio、Gemini API等平台使用Veo 2的核心功能包括文本到视频和图像到视频。同时介绍Python工具Zev用于自然语言查询终端命令、VS Code扩展RooFlow增强AI辅助开发、实时会议转录APIVexa支持多种平台并提供企业级安全保障的工具automcp。

不用向量量化也能高质量生成？NOVA：重新定义自回归视觉建模

2025年3月28日23时作者极市干货

，通过非量化建模和双向注意力机制，显著降低了训练成本并提升了生成质量，同时在文本到图像和视频任务中展

拿下近3亿元融资后，爱诗上线新模型，AI视频生成速度杀入10秒大关

2024年12月30日23时作者机器之心

机器之心原创
作者：杨文
我们实测16个Prompt：生成速度比Sora还快，动漫效果行业SOTA。

腾讯版Sora发布即开源！130亿参数，模型权重、推理代码全开放

2024年12月3日15时作者量子位

腾讯发布超大规模视频生成模型混元，参数量达130亿，并已上线用户试用。该模型具备超写实画质、高语义一致性和流畅运动画面等优势。同时支持多镜头切换和动作生成等功能。