首个开源AI音频驱动的「多人对话」视频生成项目,还能通过提示词控制角色动作。
MultiTalk 是 MeiGen-AI 开发的音频驱动多人对话视频生成框架,支持单人/多人对话、卡通角色生成和唱歌场景模拟。具备480p/720p灵活输出能力,最长15秒长视频生成能力,并引入优化技术提高性能。
MultiTalk 是 MeiGen-AI 开发的音频驱动多人对话视频生成框架,支持单人/多人对话、卡通角色生成和唱歌场景模拟。具备480p/720p灵活输出能力,最长15秒长视频生成能力,并引入优化技术提高性能。
五个项目介绍:Let Them Talk(语音驱动多人对话生成)、MemoryOS(个性化AI代理内存操作系统)、Gemini MCP Server for Claude Code(Claude增强服务器)、Spy Search(开源智能搜索框架)和ZIN MCP Client(轻量级CLI MCP客户端),涵盖多模态内容生成、AI交互控制、代码审查与分析等多个领域。