PaperWeekly
ICML 2025 Entropy不灵了?北大港中文用“区域置信”重新定义模型的不确定性
来自北京大学与香港中文大学的最新研究提出 ReCAP 框架,成功打破熵最小化在 Test-Time Training 的性能瓶颈。论文提出区域置信度代理概念,通过优化区域内模型预测不确定性与稳定性之间的联系来提升下游任务泛化性能。
每个Token都不被辜负!北大×亚马逊提出协同提示注意力机制,即插即用高效微调
北京大学联合华中科技大学、亚马逊公司提出TCPA,通过为不同token动态匹配不同提示进行注意力交互,提升高效微调方法对多样化鉴别性信息的提取能力。
ACL 2025 告别Prompt玄学!新理论揭示大模型Prompt设计的奥秘与效能
er 架构在处理复杂推理任务时仍有不足。尽管「思维链」(CoT)提示技术提供了一条实用路径,但多数方