实时视频生成归档

太惊艳！字节跳动 INFP，让虚拟对话 “活” 起来啦

2025年2月7日14时作者小兵的AI视界

INFP是字节跳动研发的一种全新的音频驱动交互式头部生成框架，它能根据双轨对话音频实时生成动态虚拟人物头像，支持多语言、唱歌模式和多种场景。研究显示其在音频-唇同步性、身份保留和动作多样性等方面表现优异。

2024年12月22日8时作者开源星探

字节最新发布的INFP是一款新颖的声控头部生成框架，支持双边互动。它能够根据输入的双轨道音频实时生成虚拟头像，并实现角色自动切换、高度真实的表情与动作同步等特性。