DeepSeek R2 参数被“意外”泄漏

DeepSeek R2参数量高达1.2万亿,采用Hybrid MoE 3.0架构,在保持模型能力的同时实现了计算资源的极致压缩,并引入了专门针对法律文书分析的新模块。其多模态精度达到92.4%,误报率低,部署优势明显,支持国产芯片优化,预计未来将减少对西方依赖。

RAG性能暴增20%!清华等推出“以笔记为中心”的深度检索增强生成框架,复杂问答效果飙升

来自清华大学、中国科学院大学、华南理工大学、东北大学的联合研究团队提出了一种全新的适应式RAG方法——DeepNote。它首次引入“笔记”作为知识载体,实现更深入、更稳定的知识探索与整合,在所有任务上均优于主流RAG方法,性能提升高达+20.1%。