模型崩溃自救指南:5行代码实现TTA鲁棒性飞跃,天大×腾讯开源COME方案

文章介绍了测试时适应(TTA)方法中的熵最小化(EM),并指出其存在的过度自信和模型崩溃问题。COME通过显式不确定性建模和自适应熵优化解决了这些问题,显著提升了模型在各种复杂场景下的预测能力。

OpenAI强化微调终于上线了:几十个样本就可轻松打造AI专家

OpenAI正式推出强化微调(RFT),通过思维链推理和任务专属评分机制提升模型特定领域的性能。目前已开放给经过验证的组织使用,并提供折扣优惠和指南。RFT适用于需要正确且可验证决策的工作流,已在芯片设计、医疗编码分配及税务分析等多个领域展示出色效果。