NeurIPS 2024 阿里云提出个性化提示策略IAP,突破大语言模型零样本推理局限 上午8时 2024/12/13 作者 PaperWeekly ©PaperWeekly 原创 · 作者 | 苑小松 单位 | 吉林大学、阿里云飞天实验室 研究方向
Muon优化器赏析:向量与矩阵有何本质区别? 上午8时 2024/12/12 作者 PaperWeekly ©PaperWeekly 原创 · 作者 | 苏剑林 单位 | 科学空间 研究方向 | NLP、神经
NeurIPS 2024 中科院自动化所提出MetaLA!线性模型架构的大一统 上午8时 2024/12/12 作者 PaperWeekly ©PaperWeekly 原创 · 作者 | 李国齐课题组 单位 | 中国科学院自动化所 目前,各种
NeurIPS 2024 让模型预见分布漂移:动态系统颠覆性设计引领时域泛化新革命 下午2时 2024/12/10 作者 PaperWeekly TL;DR: 本研究提出了一种方法,能够在领域数据分布持续变化的动态环境中,基于随机时刻观测的数据分
北理工重磅开启「流星雨计划」,深度探究大模型的自我进化能力 下午2时 2024/12/10 作者 PaperWeekly ©作者 | DIRECT LAB 单位 | 北京理工大学 本文将介绍来自 北京理工大学计算机科学与技
杀疯了!深度解析NLP底层技术—复旦大学《自然语言处理导论》 下午2时 2024/12/10 作者 PaperWeekly 《自然语言处理导论》系统介绍了基础技术和核心技术,以及基于积极学习的自然处理模型分析。本书旨在帮助读者理解NLP的基本任务和主要处理算法,涵盖从基础词汇到预训练模型的各项内容。
简单有效!Vector Quantization的又一技巧:给编码表加一个线性变换 上午8时 2024/12/10 作者 PaperWeekly ©PaperWeekly 原创 · 作者 | 苏剑林 单位 | 科学空间 研究方向 | NLP、神经
UCL、上交大等提出自然语言强化学习范式:可处理语言反馈的强化学习框架 上午8时 2024/12/10 作者 PaperWeekly ©作者 | 刘博 单位 | 新加坡国立大学 来源 | 机器之心 本论文由伦敦大学学院、上海交通大学、
CIKM 2024 通过学习相对偏好,利用预训练语言模型缓解流行度偏差 上午8时 2024/12/10 作者 PaperWeekly 引言 近年来,预训练语言模型(PLMs)被用来利用商品的文本信息以丰富长尾商品的表示。其基本思想是通
ACL 2024 多快好省!上科大提出层间KV共享的大模型高效推理新方法 上午8时 2024/12/08 作者 PaperWeekly ©PaperWeekly 原创 · 作者 | 吴昊一、吴悠 单位 | 上海科技大学 研究方向 | 自