阿里巴巴开源的 3D 动画神器,单张图片秒变可动3D人体视频!

阿里巴巴通义实验室发布的大规模人体重建模型LHM,可在几秒钟内将一张全身照片转换为可动画的3D头像,支持实时渲染和姿势控制。该模型已开源并提供在线试用和本地部署选项,能够降低技术门槛并在多个领域如内容创作、虚拟现实和游戏开发中应用。

一款刚刚开源的TTS语音模型!25ms超低延迟支持实时对话,4种规格适配全场景!

Orpheus TTS 是一款全新的开源 TTS 模型,支持接近人类的自然情感表达、超低延迟(25-50毫秒)以及强大的零样本语音克隆功能。该模型提供从 150M 到 3B 参数四种不同规模的选择。