ContextGem文档结构化数据提取框架剖析及UniversalRAG路由多模态检索思路 下午7时 2025/05/13 作者 老刘说NLP 检索思路。 另一个是文档信息抽取框架 ContextGem剖析,看看它具体怎么做的,有什么不足,有什
大模型数据预处理——关于复杂文档在大模型应用中的解决方案 下午2时 2025/04/19 作者 AI探索时代 复杂文档处理是AI的基础但门槛高。常见文本类文档如Word/PDF格式复杂难处理,影响RAG应用效果。为提高效率,可将多种文档统一转为HTML或Markdown格式,并进行进一步处理。