reward_token_ids 归档 - 每时AI

大模型对齐中的各种loss讲解

2024年11月24日23时作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨ybq
来源丨NLP工作站
编辑丨极市平台
极市导读
本文深入讲