大语言模型归档 - 第6页共24页

QwenLong-L1：迈向具备长上下文推理能力的大型语言模型的强化学习方法

2025年5月28日8时作者 NLP工程化

本文提出了一种强化学习框架QwenLong-L1，旨在提升大语言模型在长上下文中的泛化能力，并通过逐步扩展上下文长度、混合奖励函数等方法实现这一目标。

2025年5月27日16时作者量子位

复旦大学余海洋与字节的研究人员提出CAR自适应推理框架，根据模型困惑度动态选择短回答或长文本推理，在多模态视觉问答和关键信息提取任务中实现最佳平衡。

2025年5月27日16时作者机器之心

北京大学宋国杰教授团队综述论文首次系统梳理大语言模型心理测量学，提出三大革新方向，涵盖评估原则变革、新范式设计与应用项目反应理论。

2025年5月27日11时作者 NLP工程化

通过github.com/amitshekhariitbhu/build-your-own-x-machine-learning项目掌握机器学习全貌

2025年5月25日16时作者量子位

麦吉尔大学团队提出LLMSynthor方法，通过让大语言模型成为结构感知的生成器来解决数据合成中的不足问题。其核心在于统计对齐和迭代优化，能够生成结构合理、语义一致的数据，并在多个场景中验证了其有效性与稳定性。

2025年5月25日16时作者新智元

，甚至篡改脚本终止命令。不过厉害的是，它竟揪出了Linux内核中的安全漏洞，获OpenAI首席研究官

2025年5月23日23时作者新智元

emini Diffusion，引爆社交平台。真相扑朔迷离，但有一点毫无疑问：谷歌I/O大会的「黑马

2025年5月23日16时作者新智元

AI紧急修复。然而，ICLR 2025的文章揭示LLM不止会「跪舔」，还有另外5种「套路」。
上个月