学术归档 - 第105页共283页

ICLR 2025 计算开销减半！Dynamic-LLaVA刷新多模态大模型推理加速上限

2025年4月28日8时作者 PaperWeekly

段不断生成新的 token，推理过程的计算复杂度和 GPU 显存占用逐渐增加，这导致了多模态大模型推

北航联合小红书发布大模型翻译最新研究成果，重塑社交生活化翻译新范式！

2025年4月28日8时作者极市干货

合发布大模型翻译研究成果 RedTrans，通过双模型回译采样和强化学习偏好优化等创新方法，解决了社

五一出行看科技，高速巡检无人机 AI 算法开启智慧新篇

2025年4月28日8时作者极市干货

五一期间，传统高速公路巡检存在盲区、识别受限等问题。智慧交通引入无人机进行巡检，通过AI算法实现动态监测、精准识别及应急响应等功能，提升高速公路管理效率。

Transformer原作、斯坦福、清华交大三篇论文共识：基座模型边界锁死RL能力上限

2025年4月27日14时作者机器学习算法与自然语言处理

MLNLP社区是国内外知名的人工智能社区，致力于促进学术交流。该领域内的三篇论文讨论了强化学习在大模型训练中的作用，并指出模型的推理能力大部分已在预训练阶段形成，RL更多起到优化选择路径的作用。

文末送书全网催更的大模型爆款书《从零构建大模型》，中文版来了！

2025年4月27日14时作者机器学习算法与自然语言处理

《Build a Large Language Model (From Scratch)》是一本能教会普通开发者构建、训练和微调自己的大语言模型的实用指南。本书不仅解释了LLM理论及其未来，还提供了一套操作性强的路线图。作者深入浅出地讲解了从数据准备到模型部署的所有步骤，并新增了对DeepSeek模型的深度解析。