太惊艳!字节跳动 INFP,让虚拟对话 “活” 起来啦

INFP是字节跳动研发的一种全新的音频驱动交互式头部生成框架,它能根据双轨对话音频实时生成动态虚拟人物头像,支持多语言、唱歌模式和多种场景。研究显示其在音频-唇同步性、身份保留和动作多样性等方面表现优异。

字节黑科技 INFP,音频驱动的双边互动视频生成框架,实时生成,轻量又强大!

字节最新发布的INFP是一款新颖的声控头部生成框架,支持双边互动。它能够根据输入的双轨道音频实时生成虚拟头像,并实现角色自动切换、高度真实的表情与动作同步等特性。