月度归档: 2025 年 4 月
文本提示、空间映射?任意条件组合都拿下!UniCombine:统一的多条件组合式生成框架
UniCombine 是一种基于 DiT 的多条件可控生成框架,能够处理任意条件组合。它在多种多条件生成任务上达到了最先进的性能,并且构建了首个针对多条件组合式生成任务设计的数据集 SubjectSpatial200K。
羡慕o3?豆包也可以进行图片推理了!
文章介绍了字节跳动发布的新模型豆包1.5和视觉版Doubao-1.5-thinking-pro-vision,并展示了它们在推理位置、根据冰箱内容定制食谱、判断车祸原因以及家居改造建议等方面的出色表现,对比了与OpenAI o3的差异。
AI音频最新发展:Anything万物生成音频
香港科技大学开发的 AudioX 机器学习模型能够根据用户的个性化输入生成独一无二的音频和音乐作品,包括文本、视频、图像等多模态数据,具有强大的跨模态学习能力,并能处理复杂的音频生成任务如音乐补全、修复等。
只花 $100,白嫖 Cursor、Perplexity、Notion 一年 Pro 会员:这可能是 2025 年最值的联合会员
Lenny Rachitsky 的 Newsletter 提供订阅者免费一年多款热门 AI 工具,价值超15000美元。此活动包括Cursor、Replit等工具,学生可享受教育优惠价100美元/年。
覆盖40+主流模型及数据集,上海交大团队发布一站式蛋白质工程设计平台VenusFactory,一键部署教程已上线
题组开发了一个专为蛋白质工程量身打造的一站式开放平台 VenusFactory,HyperAI超神经