NeurIPS 2024 让模型预见分布漂移:动态系统颠覆性设计引领时域泛化新革命 2024年12月10日14时 作者 PaperWeekly TL;DR: 本研究提出了一种方法,能够在领域数据分布持续变化的动态环境中,基于随机时刻观测的数据分
北理工重磅开启「流星雨计划」,深度探究大模型的自我进化能力 2024年12月10日14时 作者 PaperWeekly ©作者 | DIRECT LAB 单位 | 北京理工大学 本文将介绍来自 北京理工大学计算机科学与技
杀疯了!深度解析NLP底层技术—复旦大学《自然语言处理导论》 2024年12月10日14时 作者 PaperWeekly 《自然语言处理导论》系统介绍了基础技术和核心技术,以及基于积极学习的自然处理模型分析。本书旨在帮助读者理解NLP的基本任务和主要处理算法,涵盖从基础词汇到预训练模型的各项内容。
简单有效!Vector Quantization的又一技巧:给编码表加一个线性变换 2024年12月10日8时 作者 PaperWeekly ©PaperWeekly 原创 · 作者 | 苏剑林 单位 | 科学空间 研究方向 | NLP、神经
UCL、上交大等提出自然语言强化学习范式:可处理语言反馈的强化学习框架 2024年12月10日8时 作者 PaperWeekly ©作者 | 刘博 单位 | 新加坡国立大学 来源 | 机器之心 本论文由伦敦大学学院、上海交通大学、
CIKM 2024 通过学习相对偏好,利用预训练语言模型缓解流行度偏差 2024年12月10日8时 作者 PaperWeekly 引言 近年来,预训练语言模型(PLMs)被用来利用商品的文本信息以丰富长尾商品的表示。其基本思想是通
ACL 2024 多快好省!上科大提出层间KV共享的大模型高效推理新方法 2024年12月8日8时 作者 PaperWeekly ©PaperWeekly 原创 · 作者 | 吴昊一、吴悠 单位 | 上海科技大学 研究方向 | 自
上海AI Lab提出Critic-V框架:提升视觉语言模型在多模态推理中的准确性与可靠性 2024年12月8日8时 作者 PaperWeekly 引言 在当今人工智能研究领域,视觉语言模型(VLMs)在多模态推理任务中展现了显著的进步。VLMs
准确性超Moshi和GLM-4-Voice!端到端语音双工模型Freeze-Omni 2024年12月6日13时 作者 PaperWeekly GPT-4o 提供的全双工语音对话带来了一股研究热潮,目前诸多工作开始研究如何利用 LLM 来实现端
阿里通义实验室发布IOPO,提升LLM复杂指令遵循能力 2024年12月6日13时 作者 PaperWeekly 论文标题: IOPO: Empowering LLMs with Complex Instructi