开源
一个简单高效的 LLM 强化学习库:nanoAhaMoment
GitHub 上发布 nanoAhaMoment 库,仅需单个 80G GPU 即可实现高效 LLM 强化学习训练,支持微调基础模型并附有教程。
学术型OCR天花板!这个开源多模态OCR神器,专为教育场景适配,准确率超95%!
一款专为教育场景和机器学习训练定制的Versatile-OCR-Program,支持多语言、多模态内容处理,并生成结构化输出。准确率高达90-95%,适用于PDF文档中的文本、数学公式、表格及图表提取。
实时回放+全链路监控!AgentOps如何让AI代理告别“人工智障”?
AgentOps 是一个开源平台,为 AI 代理开发、评估和监控提供一站式解决方案。它支持多种主流 AI 框架,并能与 LLM 提供商无缝集成。核心功能包括会话回放与分析、LLM 成本管理、性能监控、安全与合规性以及框架集成等。
53.9K+ Star!Browser Use:一个让AI代理轻松控制浏览器的神器
Browser Use 是一个开源项目,通过提供简单易用的接口集成多种语言模型,让AI能够控制浏览器执行自动化任务、数据抓取和复杂操作等功能。
精准提取复杂结构化数据!专为机器学习优化的强大 OCR 工具Versatile-OCR-Program
该 OCR 系统支持多语言文本、数学公式、表格、图表和图形的提取,并附带语义注释。它能生成 AI 准备的 JSON 或 Markdown 输出,包括数学表达式的描述、表格摘要和图形标题,准确率高达 90-95%。