一张图片+ 一条音频,照片开口说话唱歌,多角色、情绪控制都拿捏了。

腾讯混元联合腾讯音乐发布新模型HunyuanVideo-Avatar,支持上传照片和音频生成动态视频。该模型能自动识别场景氛围和情绪,并且可以控制角色的情绪和多角色同框对话,已在多个App中应用。

首款!能够实时生图的模型出现了

腾讯混元发布全新图片生成模型Hunyuan Image2.0,具备超快推理速度和超高质量图像生成能力,实现毫秒级出图且保持真实感。该模型可在实时对话中进行输入与输出同步处理,并提供实时绘画板功能辅助创作。

AI视频神器!腾讯混元HunyuanCustom,角色一致性大突破!

腾讯混元团队发布的HunyuanCustom新工具解决了AI生成视频中角色一致性问题,实现了图像提供身份、文本定义一切的效果。它支持单主角和多主角生成,以及视频局部编辑和音频驱动生成等模式。

图像提供身份,文本定义一切!腾讯开源多模态视频定制工具HunyuanCustom

腾讯混元团队推出HunyuanCustom框架,支持多模态输入生成主体一致性视频,实现图像、文本、音频和视频等多种条件下的定制化视频内容。该框架在数据构建和系统架构设计上引入多项技术,验证后性能表现超越现有开源模型。