大语言模型
39K 颠覆传统搜索!RAGFlow:AI驱动的开源文档搜索引擎来了!
RAGFlow 是一款基于深度文档理解的开源 RAG 引擎,能从 100 多种文件格式中高效提取关键信息,并支持文本切片、模板化处理和多种数据源。它解决了大语言模型在实际应用中的文档处理难题。
人大赵鑫教授团队出品,深入学习大语言模型!
Datawhale发布《大语言模型》中文书籍,系统介绍大语言模型技术。作者团队包括赵鑫、李军毅、周昆等专家,引用次数已突破4000次。该书注重为读者提供系统性的知识讲解,内容涵盖预训练、微调、对齐等多种基础内容。
爬虫效率暴增5倍!清华开源智能爬虫系统:支持无缝接入LLM预训练!
Crawl4LLM是清华与卡内基梅隆联合开源的智能爬虫系统,通过评估网页对语言模型预训练的价值,节省50%以上资源并提升抓取效率和质量。
微软开源的纯视觉GUI电脑屏幕解析工具升级了,速度和准确率大幅提升。
OmniParser V2发布,准确率提升和推理速度加快。OmniParser通过视觉解析界面元素,支持大语言模型,提供高效跨平台自动化解决方案。
在马斯克和奥特曼比谁喊的响的时候,DeepSeek低调发论文,梁文锋亲自参与
DeepSeek发布原生稀疏注意力(NSA)机制,在大语言模型处理64k长文本的速度上最高提升11.6倍,并实现性能反超传统全注意力模型。NSA结合算法创新和硬件优化解决了计算瓶颈,有望显著提升未来基座模型的能力。
专注于强化学习(RL)提升大语言模型(LLM)推理能力的资源库
Awesome-RL-based-LLM-Reasoning 是一个专注于提升大语言模型推理能力的资源库,汇集了最新的相关论文、幻灯片和开源项目,涵盖多种RL方法和LLM推理优化技巧。
清华、中南开源3D交互实体AI Agent LEGENT
专注AIGC领域的专业社区报道了清华大学和中南大学联合开源的可视化交互实体AI Agent模型LEGENT。它允许用户在3D虚拟空间与智能体互动,实现包括物体操作等复杂任务。
清华《DeepSeek:从入门到精通》干货分享!104页!
《DeepSeek:从入门到精通》是清华大学出版的一本深度学习和人工智能权威指南,涵盖基础概念至高级应用。本书通过实例和案例分析帮助读者掌握DeepSeek技术的模型训练与优化方法,适合各层次的学习者和研究者。