学术归档 - 第181页共283页

北邮、美团联合提出反思微调AgentRefine：微调的也能让Agent模型学会反思？

2025年2月25日16时作者 PaperWeekly

|
自然语言处理
概述
背景
基于大语言模型（LLMs）的智能体（agent）已经被证实其能像人类

2025年2月25日14时作者 GiantPandaCV

在模型大小和Batch Size确定后，通过实验逐步调整并行技术组合以优化训练吞吐量。讨论了不同配置下的内存、通信瓶颈以及节点数量增加对效率的影响，并强调了实际实验设计中的挑战与教训。

2025年2月24日23时作者机器之心

da
自 OpenAI 发布 o1-mini 模型以来，推理模型就一直是 AI 社区的热门话题，而春

2025年2月24日23时作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

2025年2月24日23时作者 PaperWeekly

本文提出了一种可逆扩散模型IDM，通过端到端训练框架和双层可逆网络设计显著提升图像重建性能与效率。在图像压缩感知重建任务中，相比其他方法，该模型在PSNR指标上提升了2dB，并将采样步数从100步减少至3步，推理速度提高了约15倍。

2025年2月24日23时作者极市干货

型语言模型在后训练量化时面临的激活量化挑战，发现GLU激活中的“激活尖峰”会导致显著的量化误差。为此

2025年2月24日23时作者 PaperWeekly

同的量化配置中（weight-only、weight-activation 和 weight-act

2025年2月24日23时作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

2025年2月24日23时作者极市干货

GaussianV2，能够在快速实现训练和压缩的同时，得到精准的几何结构与逼真的实时渲染体验。
>>

2025年2月24日23时作者 PaperWeekly

SCI一区期刊接收一篇医学类论文仅用数日，未来科研方向将聚焦AI交叉领域及高效合作导师。