中科闻歌发布智川X-Agent平台、优雅音视频大模型更新,领先技术加速AI普惠落地
中科闻歌发布智川X-Agent和优雅平台,助力政企快速落地AI应用与创意灵感。智川X-Agent提供一站式开发平台,支持零代码构建个性化智能体;优雅平台则为多模态内容生成提供智能体支持。
中科闻歌发布智川X-Agent和优雅平台,助力政企快速落地AI应用与创意灵感。智川X-Agent提供一站式开发平台,支持零代码构建个性化智能体;优雅平台则为多模态内容生成提供智能体支持。
RAGFlow 是一款基于深度文档理解的开源 RAG 引擎,能从 100 多种文件格式中高效提取关键信息,并支持文本切片、模板化处理和多种数据源。它解决了大语言模型在实际应用中的文档处理难题。
Datawhale发布《大语言模型》中文书籍,系统介绍大语言模型技术。作者团队包括赵鑫、李军毅、周昆等专家,引用次数已突破4000次。该书注重为读者提供系统性的知识讲解,内容涵盖预训练、微调、对齐等多种基础内容。
Crawl4LLM是清华与卡内基梅隆联合开源的智能爬虫系统,通过评估网页对语言模型预训练的价值,节省50%以上资源并提升抓取效率和质量。
OmniParser V2发布,准确率提升和推理速度加快。OmniParser通过视觉解析界面元素,支持大语言模型,提供高效跨平台自动化解决方案。
DeepSeek发布原生稀疏注意力(NSA)机制,在大语言模型处理64k长文本的速度上最高提升11.6倍,并实现性能反超传统全注意力模型。NSA结合算法创新和硬件优化解决了计算瓶颈,有望显著提升未来基座模型的能力。
Awesome-RL-based-LLM-Reasoning 是一个专注于提升大语言模型推理能力的资源库,汇集了最新的相关论文、幻灯片和开源项目,涵盖多种RL方法和LLM推理优化技巧。
专注AIGC领域的专业社区报道了清华大学和中南大学联合开源的可视化交互实体AI Agent模型LEGENT。它允许用户在3D虚拟空间与智能体互动,实现包括物体操作等复杂任务。