指令遵循性能归档 - 每时AI

LIFBENCH：解锁大语言模型长文本指令理解的“黑箱”

2025年7月27日14时作者机器学习算法与自然语言处理

MLNLP社区发布论文介绍LIFBENCH基准测试工具评估大语言模型在长文本输入场景下的指令遵循能力和稳定性，揭示现有模型不足，并提出未来研究方向。