开源
Openai发布Agent基准测试,小米开源自动驾驶框架,字节跳动发布Seed-Thinking-v1.5技术细节
文章介绍了五个项目或工具:BrowseComp、ReCamMaster、ORION、Seed-Thinking-v1.5 和 Agent-Wiz。它们分别专注于AI代理的浏览能力、视频生成、自动驾驶以及智能体的工作流安全评估等方面,涵盖了机器学习和人工智能领域的多个方向。
AI-Scientist-v2:AI驱动的自动化科学发现系统,助力科学研究迈向新高度
AI-Scientist-v2:一个利用AI驱动的自动化系统,显著提升科学研究效率,包括自动生成论文并被学术会议接受、跨领域探索及消除对人工模板依赖等。
OmniSVG:一个强大的矢量图形生成模型,能将文字描述瞬间转化为复杂精美的SVG图像
OmniSVG是一款强大的矢量图形生成模型,支持从简单图标到复杂动漫角色的多样化生成,采用预训练视觉语言模型,效果细腻逼真。
PDF文档解剖术!OCR神器+1,这个开源工具把复杂排版秒变结构化数据!
PDF Document Layout Analysis 是一款开源工具,基于 Vision Grid Transformer 和 LightGBM 架构,能高精度识别 PDF 中的多种元素,并确定其正确顺序。它支持高性能视觉模型和快速轻量级模型选择,同时提供多样化表格提取、公式提取等多种功能,适用于学术/业务类 PDF 处理。
快速微信聊天记录接入MCP
从本地数据库文件获取聊天数据的AI助手插件,支持微信3.x/4.0版本及Windows/macOS系统。提供Terminal UI界面及命令行工具、HTTP API服务和MCP SSE协议集成功能。
一款专为程序员打造的文档爬取和处理工具:DevDocs,开源了!
一款专为程序员打造的文档爬取和处理工具DevDocs开源,能缩短理解文档的时间至几个小时,提升开发效率。适用于企业软件开发者、网络爬虫、开发团队和独立黑客等。特点包括智能抓取、性能与速度以及内容处理等功能。
谷歌发布A2A支持MCP生态,AI之间的协作壁垒终于打破,没座这就是顶尖!
谷歌发布的A2A协议旨在支持MCP生态,它定义了智能代理之间的能力发现、任务分配和多模态通信规则,打破不同供应商间协作壁垒。通过A2A协议,智能体可以相互合作解决复杂问题,简化招聘流程等操作,未来将构建开放灵活的多代理生态系统提升企业级效率。