Anthropic新研究:用统计思维评估大模型 下午12时 2025/01/10 作者 AIGC开放社区 专注AIGC领域的专业社区,关注大语言模型的发展与应用。提出将统计思维引入大模型评估领域,通过中心极限定理和聚类标准误差等方法量化评估结果的精确性。