学术归档 - 第101页共283页

DeepSeek开源Prover-V2强推理模型，网友：奥数从没这么简单过

2025年5月1日11时作者机器之心

的新消息可没停下来。
前些天到处都在流传着 DeepSeek-R2 即将发布的传言，DeepSee

在 SGLang 中实现 Flash Attention 后端 – 基础和 KV 缓存

2025年4月30日19时作者 GiantPandaCV

basic ，由 GiantPandaLLM 翻译和Repost。作者是来自Linkedin的 Bi

在线教程丨Qwen3狂揽近20k star，网友实测：比Llama更快解决更难问题

2025年4月30日16时作者 HyperAI超神经

HyperAI超神经上线教程，一键部署Qwen3-30B-A3B模型体验。8款混合推理模型开源，性能提升显著，GitHub获近20k stars。Qwen3-30B-A3B参数量少表现佳，迅速成为开源大模型王座。HyperAI提供免费算力福利和部署教程助力更多开发者便捷体验Qwen3的强大能力。

北邮-腾讯联合提出多任务提示调优推荐框架MPT-Rec，实现效率性能双突破

2025年4月30日16时作者 PaperWeekly

破性解决方案。
北京邮电大学-腾讯联合提出两阶段多任务提示调优框架 MPT-Rec
，精准攻克知识迁

ICLR 2025 差分注意力机制爆火！DIFF Transformer击穿长文本建模天花板

2025年4月30日16时作者 PaperWeekly

建模能力为语言理解与生成带来了前所未有的突破。
然而，随着模型规模的不断扩大和应用场景的日益复杂，传

CVPR Oral 南京大学李武军教授课题组推出分布式训练算法UniAP，大模型训练最高加速3.8倍

2025年4月30日16时作者机器之心

为参与作者。
训练成本高昂已经成为大模型和人工智能可持续发展的主要障碍之一。
大模型的训练往往采用多

上交大推出首个AI智能体协议全面综述：从碎片化到互联互通的智能体网络

2025年4月30日16时作者机器之心

上海交通大学团队发布论文《A Survey of AI Agent Protocols》，提出二维分类体系和七大维度评估框架，旨在解决智能体间协议碎片化问题。该研究通过真实案例分析展示了不同协议在旅行规划中的应用差异，并对未来AI智能体协议的发展进行了展望。

只花9美元，推理能力暴涨20%！小模型Tina震撼登场，成本缩减260倍

2025年4月30日16时作者机器之心

一，一直是研究的焦点，许多的 AI 前沿人才对 AI 推理的效率进行研究。
高昂的计算成本和复杂的硬

刚刚！OpenAI回滚了最新版本的GPT-4o，因ChatGPT「过于谄媚」

2025年4月30日16时作者机器之心

「过于谄媚」的问题，所以从周一晚上开始回滚 GPT-4o 的最新更新。
免费 ChatGPT 用户

R1-Zero的无监督版本来了！SFT不再是必须，EMPO重新定义大模型推理微调

2025年4月30日16时作者 PaperWeekly

本文提出Entropy Minimized Policy Optimization (EMPO)方法，旨在实现完全无监督条件下大模型推理能力的提升。该方法不需要监督微调或人工标注的答案，仅通过强化学习训练从基模型中获得策略，并利用语义相似性聚类生成的多个回答作为奖励信号，从而在数学及其他通用推理任务上取得显著性能提升。

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30