日期: 2025 年 7 月 10 日
太牛了~~复杂表格Cell合并、跨页拼接,中文领域96%,甩MonkeyOCR 20%
本公众号介绍了一种基于Qwen2.5VL-3B模型微调的复杂表格解析工具OCRFlux。它支持HTML格式表示复杂表格结构、多列布局处理、跨页表格合并以及多语言文档解析。
快讯国产四足机器人“黑豹2.0”破世界纪录,智能手术机器人SRT-H自主完成胆囊切除,极智嘉港交所成功上市
国产四足机器人’黑豹2.0’打破世界纪录;智能手术机器人SRT-H首次自主完成胆囊切除手术;湖北人形机器人亮相第三届链博会;极智嘉上市成为全球AMR仓储机器人第一股;Hugging Face推出Reachy Mini桌面机器人。
Kyutai TTS:实时文本转语音
法国AI研究机构Kyutai Labs开源最新文本转语音技术Kyutai TTS,支持实时交互场景,性能卓越,已在GitHub和Hugging Face开放源码与模型权重。
宇树最大竞争对手来了,能下腰,可连续倒地起身,魔法原子推出新款双足人形机器人MagicBot Z1
全球领先具身智能公司魔法原子发布新款双足人形机器人MagicBot Z1,具备高性能、灵巧操作和丰富应用场景能力。
扩散语言模型写代码!速度比自回归快10倍
Inception Labs发布Mercury模型,采用扩散技术一次性生成代码并纠正错误。它比传统工具快10倍,支持多语言语法树嵌入和双向注意力机制。该模型在线可试用。