一篇介绍推理模型的 test-time scaling 技术的文章 上午8时 2025/04/25 作者 NLP工程化 文章介绍了测试时间缩放技术在提升大型语言模型推理性能方面的应用和方法,包括思维链、树形思维、自我一致性与集成投票等方法。
让 LLM 来评判 | 技巧与提示 下午2时 2025/04/09 作者 Hugging Face LLM评估模型存在内部一致性、偏好自我输出模式、输入扰动敏感性低、位置偏好偏差、冗长偏好等常见问题,文章介绍了这些偏差的原因及缓解措施。