字节跳动发布了 Seed-Thinking-v1.5 的技术细节报告,也是一个基于强化学习训练的推理模型,从分数上来看比 DeepSeek-R1 高,处于接近 Gemini-2.5-Pro 和 O3-mini-high 的水平。


参考文献:
[1] https://github.com/ByteDance-Seed/Seed-Thinking-v1.5
(文:NLP工程化)
字节跳动发布了 Seed-Thinking-v1.5 的技术细节报告,也是一个基于强化学习训练的推理模型,从分数上来看比 DeepSeek-R1 高,处于接近 Gemini-2.5-Pro 和 O3-mini-high 的水平。
参考文献:
[1] https://github.com/ByteDance-Seed/Seed-Thinking-v1.5
(文:NLP工程化)