开源AI浏览器自动化框架!14.3K+ Star,自然语言+代码,爬虫效率翻倍!
Stagehand是一款开源AI浏览器自动化框架,结合自然语言和代码控制,支持复杂任务自动化和数据提取。它通过混合编程模式集成多种AI模型,并提供预览、缓存和结构化数据提取功能。
Stagehand是一款开源AI浏览器自动化框架,结合自然语言和代码控制,支持复杂任务自动化和数据提取。它通过混合编程模式集成多种AI模型,并提供预览、缓存和结构化数据提取功能。
Checkmate 是一个基于React.js、Node.js和MongoDB的开源监控平台,支持硬件监控、网站状态检测、响应速度监控等多种功能,并提供多种告警通知方式。通过Docker一键部署,帮助用户轻松搭建监控系统。
近日B站语音团队推出的新一代语音合成模型IndexTTS2支持影视级音质、情绪克隆和时长控制。其核心模块包括输入处理、语音编码、情绪控制、时长控制和语音解码,提供零样本语音/情绪克隆和时长控制功能,并支持本地部署和双语支持。
Strands Agents Tools 是一款开源框架,提供30+预构建工具简化AI代理开发,支持文件操作、系统命令、HTTP请求和Python执行等功能,加速复杂任务自动化。
Say 是一款基于Whisper和Transformers.js的开源浏览器内语音转文字工具,提供实时转录、富文本编辑等功能,并完全本地运行保护隐私。它支持多语言识别、实时波形显示、本地存储等特性。
LiYing 是一款基于AI的证件照处理开源工具,能自动识别人脸/人体,3分钟完成抠图、换背景、裁切、排版,支持1寸-6寸规格,完全离线运行保护隐私。
自动化机器学习框架AutoGluon简化了机器学习流程,仅需3行代码即可训练高质量模型。它支持表格、图像等多种数据类型,并集成多种算法实现最优组合。
Chrome MCP Server是一款基于chrome插件的模型上下文协议 (MCP) 服务器,让AI助手直接操控Chrome浏览器进行自动化操作。它支持原生控制、20+自动化工具、跨标签页管理等功能,助力提升工作效率。
BitChat 是一款基于蓝牙的去中心化聊天应用,支持iOS/macOS系统。它采用端到端加密、自动中继转发等功能,实现了离线通信和隐私保护,目前已有5.4K Star。