PaperWeekly，作者每时AI - 第29页共45页

AAAI 2025 通义实验室提出基于辩论的弱监督对齐强模型方法，探索超级对齐新范式

2025年2月28日23时作者 PaperWeekly

和 weak-to-strong generalization 解决超级对齐问题的新范式。
论文标

2025年2月27日16时作者 PaperWeekly

腾讯 Hunyuan 团队提出 MM-IQ 基准测试框架，旨在评估多模态模型的抽象推理和逻辑思维能力。该基准包含 8 种不同推理范式，涵盖 2,710 个精心策划的测试项目，涉及逻辑运算、数学推理等多样化的题目配置。

2025年2月26日16时作者 PaperWeekly

可信人工智能
如果你对大语言模型（LLM）的
强化学习（RLHF）
感兴趣，又想从最基础的策略梯度优

2025年2月26日16时作者 PaperWeekly

论文综述大语言模型在冷启动推荐系统中的应用，涵盖内容特征、图关系、域信息及大语言模型世界知识等方面的研究进展与路线图。

2025年2月26日16时作者 PaperWeekly

该项目提出3D意图定位（3D-IG），旨在根据用户的意图在3D场景中检测目标物体，而非仅依赖明确的物体描述。通过引入动宾对齐、候选框匹配和级联自适应学习等技术，该方法显著提升了性能。

2025年2月25日16时作者 PaperWeekly

区广泛发酵，不过并不是期待中的 Claude 4.0，而是 3.7 Sonnet 版本。
▲ 图源：

2025年2月25日16时作者 PaperWeekly

文题目：
Uncertainty-Aware Graph Structure Learning
论文

2025年2月25日16时作者 PaperWeekly

|
自然语言处理
概述
背景
基于大语言模型（LLMs）的智能体（agent）已经被证实其能像人类

2025年2月24日23时作者 PaperWeekly

本文提出了一种可逆扩散模型IDM，通过端到端训练框架和双层可逆网络设计显著提升图像重建性能与效率。在图像压缩感知重建任务中，相比其他方法，该模型在PSNR指标上提升了2dB，并将采样步数从100步减少至3步，推理速度提高了约15倍。

2025年2月24日23时作者 PaperWeekly

同的量化配置中（weight-only、weight-activation 和 weight-act