跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

文档解析

一篇80页多模态RAG技术最新综述:MRAG3.0

2025年4月16日19时 作者 PaperAgent

多模态检索增强型生成(MRAG)通过整合文本、图像和视频等多模态数据显著提升了大型语言模型的生成质量,并系统回顾了其进展与关键技术组件。

分类 分享 标签 MRAG、 图像、 搜索规划、 文本、 文档解析、 视频 发表评论

Agent框架标准化趋势及OpenManus-RL增强Agent规划能力训练框架

2025年3月12日14时 作者 老刘说NLP

老老实实解析底层xml,转pdf再解析(有很多现成的工具库了),绕了大圈,效果还不保证,例如表格,除

分类 大模型 标签 2025年3月12日、 pdf效果、 word解析、 xml转换、 文档解析、 统一结构化Responses 发表评论

太牛了!OWL:Manus 最强开源复现,开源框架GAIA基准测试中排第一!

2025年3月11日8时 作者 开源星探

OWL 是目前最好的 Manus 开源复现版本,基于 CAMEL-AI 框架构建,支持多种功能如实时信息检索、多模态处理等,并提供了四种部署方式。

分类 开源 标签 CAMEL-AI、 OpenManus、 Qwen、 多智能体协作、 实时信息检索、 文档解析 发表评论

再看文档解析该如何做?pipeline派及end2end两派路线及代表工具

2025年3月5日14时 作者 老刘说NLP

主要方向之一。
我们在
文档智能专
题
https://mp.weixin.qq.com/mp/ap

分类 大模型 标签 会员社区、 冷饭、 文档解析、 泛化能力、 端到端模型、 结构化信息 发表评论
较新文章
← 上一页 页面1 页面2

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • DeepMind率先拿下IMO金牌,却被OpenAI 抢先发布了……
  • 从 n8n 到 Claude Code:我试了 10 类爆火 AI 工具,发现不用融资也能干正事
  • 大模型再爆弱点!旧记忆忘不掉,新记忆分不出,准确率暴降 ICML’25
  • Kimi又火了,深度体验它的第一个Agent 后,我发现99%的AI产品忽略了这件「小事」
  • 谷歌AlphaFold得了诺奖,但DeepMind根本没引用前人论文?

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×