学术
DPO-Shift:一个参数可控改变DPO分布,缓解似然偏移
在人工智能领域,直接偏好优化(DPO)方法因其简单易用和稳定性而受到广泛关注,但其训练过程中会出现似然位移现象。本文提出DPO-Shift方法,在Bradley-Terry模型中增设参数函数以缓解该问题,并通过理论分析与实验验证了其有效性。
视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源
视觉强化微调项目 Visual-RFT 通过规则奖励和强化学习方法,实现了视觉语言模型在目标检测、分类等任务中的高效提升。项目已开源,欢迎加入。
CVPR 2025录用结果出炉!这些方向杀疯了!
CVPR 2025录用结果出炉!今年共13008篇论文投稿,最终录取率仅为22.1%。大模型时代的研究方向集中在端到端、闭环仿真3DGS、多模态大模型和扩散模型等前沿领域。科研辅导服务帮助学生解决选题、实验设计、创新点设计等问题。
模型参数超 RFdiffusion 5倍!英伟达等发布 Proteina,从头设计蛋白质主链性能达 SOTA
所 Mila、蒙特利尔大学、麻省理工学院的研究团队,开发出了一种新型大规模流式蛋白质主链生成器 ——
刚刚,Anthropic完成35亿美元新融资,估值飙升至615亿美元,网友催发Claude 4
Anthropic 宣布完成35亿美元E轮融资,投后估值达615亿美元。该资金将用于开发下一代AI系统、增强计算能力及深化研究。