南开大学
ICCV 2025 南开等提出REG方法,直接、高效地利用判别性信息,几十倍加速扩散模型训练!
本文提出了一种名为REG的方法,通过将低级图像潜在表示与高级类别令牌进行‘纠缠’来加速扩散模型的训练,并在ImageNet上实现了高达63倍的训练加速。
AI杯·2025星际争霸2锦标赛夏季赛邀你一起战斗!
各位AI学习爱好者、电竞游戏狂热者、以及充满激情的大学生们,《2025 AI杯·星际争霸2锦标赛》国内首个AI大模型电竞赛事现已开启。组织机构包括AIGC开放社区和微软技术支持,比赛涵盖小组赛、决赛等多个阶段,提供丰富的报名福利及丰厚奖品。
单提示生成「主体一致」图像,且无需训练!已斩获ICLR 2025 Spotlight
南开大学等机构提出的新方法1Prompt1Story无需额外训练即可实现人物形象一致的文图生成,通过整合多个提示、奇异值重加权和身份保持交叉注意力技术,解决了现有方法存在的问题。
必看!VividTalk:阿里、南大等联合打造,一张照片+音频秒变说话头像视频黑科技
VividTalk是南京大学、阿里巴巴、字节跳动和南开大学联合开发的人工智能技术项目,通过音频驱动生成逼真的说话头像视频。该项目采用先进的3D混合先验技术和双分支运动-VAE(变分自编码器)来实现高质量的视觉效果和自然同步对话。
明日开播!精度优于AlphaFold,基于深度学习实现生物大分子及其互作的三维结构预测
南开大学郑伟教授将分享基于深度学习的生物大分子及其互作三维结构预测。他将在AI4S系列直播中介绍AlphaFold3之外的研究成果及经验。