字节开源了一款多主体视频模型!掩码黑科技解锁多主体丝滑控制!
字节跳动MAGREF项目通过掩码引导机制实现了连贯多主体视频生成,支持单人、多人及人物+物品组合。该框架采用像素级通道拼接和区域感知动态掩码技术,生成自然流畅的多主体视频。
字节跳动MAGREF项目通过掩码引导机制实现了连贯多主体视频生成,支持单人、多人及人物+物品组合。该框架采用像素级通道拼接和区域感知动态掩码技术,生成自然流畅的多主体视频。
字节跳动在火山引擎Force大会上推出多款新AI产品,其中Seedance 1.0 pro视频生成模型在文生视频和图生视频任务中表现突出,尤其擅长多镜头叙事、人物动作控制流畅自然等。
字节跳动旗下火山引擎发布豆包大模型1.6、视频生成模型Seedance 1.0 Pro等新模型,并宣布多项创新服务,包括按输入长度区间定价和降低Agent开发门槛。
火山引擎发布豆包1.6及视频生成模型Seedance 1.0 pro,支持多模态理解和图形界面操作,推动AI云原生服务升级。豆包大模型在电商、自动驾驶等场景应用广泛,市场份额第一。
复旦大学和字节跳动团队联合提出CreatiDesign新模型,可实现高精度、多模态、可编辑的AI图形设计生成。该模型解决了扩散Transformer架构在处理图形设计时面临的统一建模、精细解耦控制及大规模高质量标注数据缺失等问题。
人形机器人研发商加速进化近日完成A轮融资,融资资金将用于产品迭代升级和规模化量产交付。其核心团队成员包括清华大学博士程昊等。加速进化专注于双足人形机器人研究,并在全球赛事中取得佳绩。该公司已累计交付数百台人形机器人给多国客户。
字节跳动开源多模态模型BAGEL,支持图像生成、修改及动态变化理解。具备聊天、生成图片、编辑图片、风格转换和导航等能力。