CVPR2025|MCA-Ctrl:多方协同注意力控制助力AIGC时代图像精准定制化

本文提出了一种无需微调的通用图像定制方法——多主体协同注意力控制(MCA-Ctrl),通过扩散模型实现精确的背景和布局控制,解决了现有技术方案中的关键瓶颈。

字节Seed新方法!开源8B代码模型:自己筛数据训练自己,同量级SoTA,还能超越百亿级对手

MLNLP
社区致力于推动国内外自然语言处理与机器学习领域的交流合作。近期,
Seed-Coder团队开发了一种能自我筛选数据的代码模型,该模型在多个测试中表现优异。

SIGGRAPH 2025 快手可灵团队提出3D感知的可控电影级视频生成工作CineMaster!

近期,可灵研究团队推出的CineMaster电影级文本到视频生成框架允许用户通过3D感知控制目标和相机运动来创作高质量视频内容。该方法在SIGGRAPH 2025会议中被收录,并展示了从任意视频中提取3D控制信号的数据构建流程。