NLP工程化
一款能从任何文档中提取文本的开源工具:Kreuzberg
Kreuzberg 是一款开源工具,能从各种文件格式(如 PDF、图像、Word 文档)中自动化提取文本,支持 GPU 无要求且提供统一的异步接口。
GSM8K-RLVR:用强化学习提升语言模型的数学解题能力
GSM8K-RLVR利用强化学习提升语言模型数学解题能力,Qwen2.5-Math-1.5B模型准确率从70.66%提升至77.33%,简化提示格式无需复杂标签。
Kreuzberg 是一款开源工具,能从各种文件格式(如 PDF、图像、Word 文档)中自动化提取文本,支持 GPU 无要求且提供统一的异步接口。
GSM8K-RLVR利用强化学习提升语言模型数学解题能力,Qwen2.5-Math-1.5B模型准确率从70.66%提升至77.33%,简化提示格式无需复杂标签。