AI视频神器!腾讯混元HunyuanCustom,角色一致性大突破!
腾讯混元团队发布的HunyuanCustom新工具解决了AI生成视频中角色一致性问题,实现了图像提供身份、文本定义一切的效果。它支持单主角和多主角生成,以及视频局部编辑和音频驱动生成等模式。
腾讯混元团队发布的HunyuanCustom新工具解决了AI生成视频中角色一致性问题,实现了图像提供身份、文本定义一切的效果。它支持单主角和多主角生成,以及视频局部编辑和音频驱动生成等模式。
Google更新了两款Gemini新模型Gemini 2.5 Pro和Gemini 2.5 Flash,在视频理解和生成方面表现突出,能生成互动应用、p5.js动画及精准描述视频片段。
如今音乐家依靠多样化工具生态系统进行创作。谷歌推出Music AI Sandbox,包括Lyria 2模型,助力用户生成和探索新音乐风格。Lyria 2提供高保真度音频输出及实时交互式创作功能。
Datawhale携手萨里国际学院举办‘未来商领·AI赋能’项目圆满结束,吸引了200余名学生及80余名校友参与,学员们通过团队合作开发出53份AI智能体工具,并在Demo Day中展示。最终有16组作品获奖,萨里国际学院受邀参加“2050@2025大会”分享项目经验。
具身AI研究涵盖了单智能体和多智能体系统,并介绍了不同方法在控制、学习和生成模型中的应用。重点讨论了MAS的控制与规划、学习以及基于生成模型的交互机制。
OpenAI CEO Sam Altman 对中国AI企业DeepSeek表示担忧,称其可能成为美国默认AI应用。但同时指出,目前DeepSeek并未达到这一程度。
腾讯混元团队推出HunyuanCustom框架,支持多模态输入生成主体一致性视频,实现图像、文本、音频和视频等多种条件下的定制化视频内容。该框架在数据构建和系统架构设计上引入多项技术,验证后性能表现超越现有开源模型。
阿里巴巴通义团队开源的ZeroSearch是一款大模型驱动的生成式搜索引擎框架,无需调用外部搜索接口,实现低成本高性能检索能力。其通过强化学习训练提升大语言模型的搜索能力,在多个公开问答数据集上表现优异且成本大幅降低。