比肩LLaMA 3!人大高瓴提出语言模型新范式:首个8B扩散大语言模型LLaDA 2025年2月22日23时 作者 PaperWeekly 突破性进展,展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。目前,普遍的观点认为其成功依赖于自
图像生成迎来CoT时刻!港中文首次提出文生图的o1推理和inference scaling新范式 2025年2月7日16时 作者 PaperWeekly 理能力的强大提升,各种基于强化学习 RL 和提升 test-time 推理成本的方案 已经在大模型理
顶刊TPAMI 2025!清华提出Hyper-YOLO,目标检测+超图计算实现新SOTA 2025年2月4日16时 作者 PaperWeekly ©作者 | iMoon-Lab 单位 | 清华大学 来源 | 新智元 YOLO(You Only L
浙大、南栖仙策推出SMAC-HARD,多智能体强化学习算法评估Hard模式来了 2025年1月6日16时 作者 PaperWeekly ©作者 | 邓悦 单位 | 浙江大学博士生 来源 | 机器之心 本文作者来自浙江大学、中国科学技术大
AAAI 2025 UC Berkeley、阿里提出NMT,四行代码解决搜推任务中的目标冲突问题 2025年1月6日16时 作者 PaperWeekly ©PaperWeekly 原创 · 作者 | 咕咕 背景:工业界中的目标冲突问题 在工业界实际的搜广
浙大、微软等发布最新综述,深入探索语音对话模型的前沿进展 2024年12月30日23时 作者 PaperWeekly ©作者 | 季圣鹏 单位 | 浙江大学 在人机交互日益智能化的今天,语音对话模型正引领 AI 领域的
NeurIPS 2024 让模型预见分布漂移:动态系统颠覆性设计引领时域泛化新革命 2024年12月10日14时 作者 PaperWeekly TL;DR: 本研究提出了一种方法,能够在领域数据分布持续变化的动态环境中,基于随机时刻观测的数据分
简单有效!Vector Quantization的又一技巧:给编码表加一个线性变换 2024年12月10日8时 作者 PaperWeekly ©PaperWeekly 原创 · 作者 | 苏剑林 单位 | 科学空间 研究方向 | NLP、神经
准确性超Moshi和GLM-4-Voice!端到端语音双工模型Freeze-Omni 2024年12月6日13时 作者 PaperWeekly GPT-4o 提供的全双工语音对话带来了一股研究热潮,目前诸多工作开始研究如何利用 LLM 来实现端
Text-to-SQL新SOTA!华科团队提出双向模式链接新方法RSL-SQL 2024年12月4日14时 作者 PaperWeekly 论文标题: RSL-SQL: Robust Schema Linking in Text-to-SQ