图像提供身份,文本定义一切!腾讯开源多模态视频定制工具HunyuanCustom
腾讯混元团队推出HunyuanCustom框架,支持多模态输入生成主体一致性视频,实现图像、文本、音频和视频等多种条件下的定制化视频内容。该框架在数据构建和系统架构设计上引入多项技术,验证后性能表现超越现有开源模型。
腾讯混元团队推出HunyuanCustom框架,支持多模态输入生成主体一致性视频,实现图像、文本、音频和视频等多种条件下的定制化视频内容。该框架在数据构建和系统架构设计上引入多项技术,验证后性能表现超越现有开源模型。
腾讯混元与InstantX合作推出开源版角色生成插件InstantCharacter,基于DiTs架构实现高保真度和个性化角色创作,克服了传统方法的限制。
MLNLP社区是国内外知名的机器学习与自然语言处理社区。《数学能力的重大突破:腾讯发布的DeepMath-103K》介绍了一种包含10.3万道高难度数学题的数据集,旨在提升模型的数学推理能力。
腾讯元宝通过混元T1+DeepSeek-R1双模型架构提升职场效率,尤其在复杂项目中表现突出。它能够处理逻辑链长、跨领域知识的任务,并实时抓取数据生成动态报告。文章介绍了其在会议纪要、文档处理、创意生产、行业研究和个人知识管理等多方面的应用及其价值。