月度归档: 2024 年 12 月
KDD 2025 人大团队提出多任务贝叶斯联邦学习算法,同时处理分类和回归
本文介绍了一篇关于多任务贝叶斯联邦学习的文章,该文章在KDD 2025上被接收。通过结合局部设备下的多任务学习与全局水平的联邦学习,缓解了有限数据下的过拟合问题,并展示了其在分类和回归任务中的优越性能。
DeepSeek V3刷屏,550万元2000张卡做出的开源模型,和OpenAI几亿烧出来的一样好
作者
|
王兆洋
邮箱
|
wangzhaoyang@pingwest.com
像是迷雾中走出的一头
把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源
本文介绍了一种名为GRAPE的新算法,用于改善视觉-语言-动作模型在机器人任务中的泛化能力。通过偏好对齐提升策略的灵活性和适应性,支持多种目标如安全性和效率。