日期: 2025 年 4 月 11 日
CVPR 2025 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别
e Lee,团队其他成员还包括孔令东与黄田鑫博士。
主页:https://dylanorange.g
AI-Scientist-v2:AI驱动的自动化科学发现系统,助力科学研究迈向新高度
AI-Scientist-v2:一个利用AI驱动的自动化系统,显著提升科学研究效率,包括自动生成论文并被学术会议接受、跨领域探索及消除对人工模板依赖等。
谷歌Agent2Agent和Anthropic MCP的深度对比
Agent2Agent (A2A) 和 MCP 是两个增强智能体能力的协议,MCP 用于智能体连接外部系统,而 A2A 侧重于让多个智能体协作和共享信息。本文分析了它们的区别、应用场景和代码示例。
OmniSVG:一个强大的矢量图形生成模型,能将文字描述瞬间转化为复杂精美的SVG图像
OmniSVG是一款强大的矢量图形生成模型,支持从简单图标到复杂动漫角色的多样化生成,采用预训练视觉语言模型,效果细腻逼真。
PDF文档解剖术!OCR神器+1,这个开源工具把复杂排版秒变结构化数据!
PDF Document Layout Analysis 是一款开源工具,基于 Vision Grid Transformer 和 LightGBM 架构,能高精度识别 PDF 中的多种元素,并确定其正确顺序。它支持高性能视觉模型和快速轻量级模型选择,同时提供多样化表格提取、公式提取等多种功能,适用于学术/业务类 PDF 处理。
谷歌推出AI智能体交互协议 Agent2Agent了
谷歌推出了Agent2Agent智能体协作协议A2A,旨在打破当前智能体市场的割据状态。通过开放协议,谷歌希望打造智能体世界的通用协议,并构建以谷歌云为核心的生态系统。