开源离线AI证件照神器!开箱即用,3分钟一键搞定抠图、换背景、排版!
LiYing 是一款基于AI的证件照处理开源工具,能自动识别人脸/人体,3分钟完成抠图、换背景、裁切、排版,支持1寸-6寸规格,完全离线运行保护隐私。
LiYing 是一款基于AI的证件照处理开源工具,能自动识别人脸/人体,3分钟完成抠图、换背景、裁切、排版,支持1寸-6寸规格,完全离线运行保护隐私。
自动化机器学习框架AutoGluon简化了机器学习流程,仅需3行代码即可训练高质量模型。它支持表格、图像等多种数据类型,并集成多种算法实现最优组合。
Chrome MCP Server是一款基于chrome插件的模型上下文协议 (MCP) 服务器,让AI助手直接操控Chrome浏览器进行自动化操作。它支持原生控制、20+自动化工具、跨标签页管理等功能,助力提升工作效率。
BitChat 是一款基于蓝牙的去中心化聊天应用,支持iOS/macOS系统。它采用端到端加密、自动中继转发等功能,实现了离线通信和隐私保护,目前已有5.4K Star。
一款名为TrWebOCR的离线中文OCR工具在GitHub上受到关注,其特点包括本地运行保护隐私、高识别率适合中文文档等。通过Docker部署简单高效,并提供Web界面和API接口支持快速文字识别。
GitHub爆火隐形AI桌面助手Glass开源仅2天即获3.3K+ Star,能捕捉屏幕和音频活动并生成结构化信息。核心能力包括实时问答、会议记录等,零干扰设计适用于多种场景如远程协作与知识管理。
Kyutai TTS 是一款基于Delayed Streams Modeling(DSM)框架的实时文本转语音(TTS)模型,支持流式文本输入、超低延迟和高保真语音生成。参数量为1.6B,英语/法语WER分别为2.82%和3.29%,语音相似度为77.1%/78.7%。
推荐跨平台划词翻译和OCR软件Pot,支持Windows/macOS/Linux系统,包含多项核心功能如划词翻译、截图OCR等,并可集成多种翻译接口。
WaterCrawl 是一款基于 Python 和 Scrapy 的开源网页爬虫工具,专为大规模数据提取和LLM优化设计。支持多语言内容抓取、实时进度监控和深度AI平台集成。