大模型归档 - 第53页共147页

北邮-腾讯联合提出多任务提示调优推荐框架MPT-Rec，实现效率性能双突破

2025年4月30日16时作者 PaperWeekly

破性解决方案。
北京邮电大学-腾讯联合提出两阶段多任务提示调优框架 MPT-Rec
，精准攻克知识迁

ICLR 2025 差分注意力机制爆火！DIFF Transformer击穿长文本建模天花板

2025年4月30日16时作者 PaperWeekly

建模能力为语言理解与生成带来了前所未有的突破。
然而，随着模型规模的不断扩大和应用场景的日益复杂，传

R1-Zero的无监督版本来了！SFT不再是必须，EMPO重新定义大模型推理微调

2025年4月30日16时作者 PaperWeekly

本文提出Entropy Minimized Policy Optimization (EMPO)方法，旨在实现完全无监督条件下大模型推理能力的提升。该方法不需要监督微调或人工标注的答案，仅通过强化学习训练从基模型中获得策略，并利用语义相似性聚类生成的多个回答作为奖励信号，从而在数学及其他通用推理任务上取得显著性能提升。

Qwen3的混合思考模式再探析及推理大模型系列专题指引

2025年4月30日14时作者老刘说NLP

前大家在纠结R1过度思考等问题，做了许多工程化改造，但是Qwen3模型一更新，在这个技术洪流之下，又

AI 文生数据：真正实现“自动生成+自动整理+自动保存”的闭环

2025年4月30日14时作者 AI技术研习社

文章介绍了一种新的方法——用AI自动生成高质量问答数据集的方法，通过这种流程，用户可以在几分钟内生成、整理并保存结构化的训练数据集。这种方法能显著提高效率，并节省大量时间成本。

RAG提升召回准确率的解决方案——关于相似度计算与Rerank重排序的问题研究

2025年4月30日14时作者 AI探索时代

最近在RAG项目中使用milvus向量数据库时遇到问题，文档格式复杂导致相似度较低，提出通过重排序、多路召回等方式解决数据干扰因素变多的问题。

造梦师手记：最快的Flux，快就是好

2025年4月30日11时作者路过银河AI

Art-Hyper-Flux-Dev
这个大模型最大的优点是快，只需要8-10步就可以跑出非常精致的

33,000美元奖金池！Meta CRAG-MM挑战赛开启，多模态RAG巅峰对决

2025年4月29日23时作者 PaperWeekly

Meta CRAG-MM Challenge 2025面向可穿戴设备场景设计，旨在提升视觉问答基准数据集的准确性、上下文理解和实时信息处理能力。通过三个逐层递进的任务全面考察多模态检索增强生成（MM-RAG）系统在现实中的应用。

模仿or探索？LUFFY：我全都要！巧妙融合外部指导，RL推理不再死板

2025年4月29日16时作者 PaperWeekly

仿学习只学不练、强化学习只练不学”的传统壁垒。
论文标题：
Learning to Reason u

DeepWiki、Chatwiki及DeepSeek-R1T-Chimera进展

2025年4月29日14时作者老刘说NLP

今日2025年4月28日星期日，北京晴。简述Deepresearch与RAG进展及DeepSeek-R1实验模型。DeepWiki为GitHub仓库提供AI驱动的实时交互式文档；Chatwiki为企业打造智能客服机器人问答系统，支持多级权限控制和多种数据导入方式。介绍DeepSeek-R1T-Chimera微调模型，相比原始版本运行速度更快，输出标记数量减少40%。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31