NLP工程化
QwenLong-L1:迈向具备长上下文推理能力的大型语言模型的强化学习方法
本文提出了一种强化学习框架QwenLong-L1,旨在提升大语言模型在长上下文中的泛化能力,并通过逐步扩展上下文长度、混合奖励函数等方法实现这一目标。
字节Dolphin:多模态文档图像解析模型
Dolphin 是一种新颖的多模态文档图像解析模型,采用‘分析后解析’范式,通过两阶段方法高效处理文本段落、图表、公式和表格等交织内容,实现了卓越的解析效率。
App Runner和Task Pipeline中的数据库连接管理指南
文章讨论了Flask-Sqlalchemy在App Runner和任务管道中的数据库操作连接管理问题,并提出通过及时关闭连接解决长时间运行任务占用数据库连接的问题。