PaperWeekly 归档 - 第3页共4页 - 每时AI

TPAMI 2025顶刊！基于脉冲驱动Transformer的高效且可扩展训练方法

2025年3月13日16时作者 PaperWeekly

神经网络（ANN）的潜在替代方案。然而，SNN 在实际应用中面临性能差距和训练成本高的挑战。
为此我

ICLR 2025 阿里等提出LLaVA-MoD，用MoE+蒸馏训练轻量化多模态大模型

2025年3月7日16时作者 PaperWeekly

小模型的网络结构，并提出 Dense-to-Sparse 蒸馏框架，结合两阶段蒸馏策略（模仿蒸馏+偏

WWW 2025 TAMU、UIUC等提出全新因素链框架，用于论文-评审人匹配

2025年3月5日23时作者 PaperWeekly

提交数量的迅速增加，我们越来越依赖有效的论文-评审人匹配模型。此前在这一领域的研究考虑了多种因素来评

ICLR 2025 SOTA性能！OSTQuant：基于正交与缩放变换的大模型量化方法

2025年2月24日23时作者 PaperWeekly

同的量化配置中（weight-only、weight-activation 和 weight-act

比肩LLaMA 3！人大高瓴提出语言模型新范式：首个8B扩散大语言模型LLaDA

2025年2月22日23时作者 PaperWeekly

突破性进展，展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。目前，普遍的观点认为其成功依赖于自

图像生成迎来CoT时刻！港中文首次提出文生图的o1推理和inference scaling新范式

2025年2月7日16时作者 PaperWeekly

理能力的强大提升，各种基于强化学习 RL 和提升 test-time 推理成本的方案
已经在大模型理

顶刊TPAMI 2025！清华提出Hyper-YOLO，目标检测+超图计算实现新SOTA

2025年2月4日16时作者 PaperWeekly

©作者 |
iMoon-Lab
单位 |
清华大学
来源 |
新智元
YOLO（You Only L

浙大、南栖仙策推出SMAC-HARD，多智能体强化学习算法评估Hard模式来了

2025年1月6日16时作者 PaperWeekly

©作者 |
邓悦
单位 |
浙江大学博士生
来源 |
机器之心
本文作者来自浙江大学、中国科学技术大

AAAI 2025 UC Berkeley、阿里提出NMT，四行代码解决搜推任务中的目标冲突问题

2025年1月6日16时作者 PaperWeekly

©PaperWeekly 原创 · 作者 |
咕咕
背景：工业界中的目标冲突问题
在工业界实际的搜广

浙大、微软等发布最新综述，深入探索语音对话模型的前沿进展

2024年12月30日23时作者 PaperWeekly

©作者 |
季圣鹏
单位 |
浙江大学
在人机交互日益智能化的今天，语音对话模型正引领 AI 领域的