解锁文档处理新高度!这个开源神器支持OCR+机器学习,超丰富的API接口,效率翻倍!

Dedoc是一款ISPRAS团队开源的文档提取与转换工具,支持多格式文档处理,包括Office、PDF和扫描件等,并能智能提取表格、文本格式和逻辑结构。其核心功能亮点涵盖文档逻辑结构提取、复杂表格解析以及OCR扫描件处理。

Playwright MCP:微软打造的AI自动化利器,一键搞定浏览器操作

微软推出的Playwright MCP项目通过MCP协议实现了大模型与浏览器自动化交互。支持多种主流浏览器,并提供丰富的交互功能,如点击、拖动、输入文本等,广泛适用于自动化测试、网页自动化操作以及与大语言模型集成等多种场景。

阿里巴巴开源Qwen3 Embedding 多语言排行榜中排名第一,微软开源GUI-Actor 无坐标的GUI代理视觉语言模型

Qwen3 Embedding 提供不同规模的文本嵌入和重排序模型;GUI-Actor 项目实现无需坐标的GUI交互方法;MonkeyOCR 使用结构-识别-关系三元组进行文档解析;Gemini for Claude Code 将Google Gemini模型与Claude Code结合使用,并提供API转换和错误处理功能;CircuitManus 是一个通用的高级异步智能体平台,专注于电路设计并支持跨领域扩展。