刚刚,OpenAI开放GPT-4.1偏好优化DPO,ChatGPT能真正学会你的「品味」了!
OpenAI宣布GPT-4.1系列模型支持Direct Preference Optimization (DPO)微调技术,允许用户通过对比两个回答来优化AI偏好。这一更新让AI学会用户的品味成为可能。
OpenAI宣布GPT-4.1系列模型支持Direct Preference Optimization (DPO)微调技术,允许用户通过对比两个回答来优化AI偏好。这一更新让AI学会用户的品味成为可能。