全网首发|一手内测字节OmniHuman-1,这就是当今最强的AI数字人。

半个月前,字节的OmniHuman-1模型在全球掀起波澜。它能通过一张照片和一段音频生成背景动态、支持全身动作的AI视频,并保持口型同步。OmniHuman-1在即梦平台上开放内测,实现一键生成带表演与口型的短视频效果。

重磅!字节发布UI-TARS大模型,三句话搞定电脑操作!碾压GPT-4!

字节发布UI-TARS视觉语言模型,能像人一样操控电脑界面,并在多项测试中击败GPT-4等对手。它具备感知、推理及行动能力,支持点击、输入等多种操作。UI-TARS通过SFT和DPO训练,在多个GUI代理基准测试中达到最佳成绩,还开源了桌面版应用。