学术
200美金,人人可手搓QwQ,清华、蚂蚁开源极速RL框架AReaL-boba
蚂蚁技术研究院和清华大学交叉信息院联合发布训练速度最快最稳定的开源强化学习训练框架AReaL,显著提升了数学推理能力,并通过创新性数据蒸馏技术复现了32B模型训练。
ICLR 2025 真正「Deep」的「Research」,通过强化学习实现可自主进化的科研智能体来了!
CycleResearcher 研究团队发布了首个通过强化学习迭代优化训练的 AI 科研智能体,实现了文献检索、模型提问、论文撰写等完整闭环。团队开源了数据集和代码,展示了其在学术研究中的潜力。
吉卜力只是开胃小菜,GPT-4o一键抠图「换装换背景」!推理也初步显现
这几天,AI圈最火的是GPT-4。OpenAI发布的新功能让图像生成更加灵活方便,可灵与GPT-4合作制作了《甄嬛传》的吉卜力风格版本,并展示了画笔编辑功能,用户可以直接修改图片细节。模型还能显示推理过程和思维链,这引发了关于GPT-5是否即将问世的讨论。
CVPR 2025 EmoEdit:情感可编辑?深大VCC带你见证魔法!
EmoEdit 通过图像编辑技术实现了情感表达的效果。论文提出了EmoEdit框架,利用大规模AIM数据集和情感增强模块提升扩散模型的情感感知能力,最终在多维度实验中展示了其显著的情感编辑效果。