关注我,记得标星⭐️不迷路哦~
✨ 1: Suna
Suna是开源AI助手,通过自然对话实现研究、数据分析和自动化工作流等任务,并集成多种工具。

Suna 是一个开源的通用人工智能助手,旨在帮助用户轻松完成各种现实世界的任务。它通过自然的对话与用户交互,可以进行研究、数据分析并解决日常问题。
核心功能:
- 浏览器自动化:
能够无缝地浏览网页并提取数据。 - 文件管理:
支持文档的创建和编辑。 - 网络爬虫与扩展搜索:
具备网络爬取和高级搜索能力。 - 命令行执行:
能够执行系统任务。 - 网站部署:
支持网站的部署。 - API 集成:
可与其他 API 和服务集成。
地址:https://github.com/kortix-ai/suna
✨ 2: ElatoAI
ElatoAI是基于ESP32的实时AI语音方案,通过OpenAI API实现长时间全球对话。
ElatoAI是一个基于ESP32的实时AI语音项目,它利用OpenAI的Realtime API、ESP32微控制器、安全WebSockets以及Deno Edge Functions,旨在实现长达10分钟以上的、不间断的全球对话。简单来说,它能让你与AI进行实时的语音对话,就像拥有一个AI机器人一样。
- 实时语音转换:
使用OpenAI API进行快速语音到语音的转换。 - 自定义AI代理:
创建具有独特个性和声音的AI角色。 - 可定制的声音:
提供多种声音和个性选择。 - 安全通信:
使用加密的WebSockets进行可靠的通信。 - 低延迟:
通过Deno Edge Functions优化,实现全球范围内的低延迟。
地址:https://github.com/akdeb/ElatoAI
✨ 3: Hyperagent
Hyperagent是一款利用LLM增强Playwright的智能浏览器自动化工具,提供AI指令和防检测等功能。

Hyperagent 是一个集成了 AI 功能的 Playwright 浏览器自动化工具。简单来说,它给 Playwright 赋予了智能,使得浏览器自动化任务变得更加灵活和强大。
- AI 命令:
提供简单的 page.ai()
和executeTask()
API,可以用于各种 AI 自动化任务。 - 隐身模式:
内置了反检测机制,避免被网站识别为机器人。 - 回退到 Playwright:
在不需要 AI 的时候,可以像普通 Playwright 一样使用。 -
**可以定义输出格式:**可以指定一个Zod schema来定义输出的数据结构,方便后续处理。 - 支持多种LLM:
可以使用OpenAI, Anthropic等等。 - 支持自定义Actions:
允许用户自定义操作,扩展Hyperagent的功能。
地址:https://github.com/hyperbrowserai/HyperAgent
✨ 4: Hyper-RAG
Hyper-RAG是一个利用超图建模知识关联的检索增强生成方法,可有效提升LLM性能并减少幻觉。

Hyper-RAG 是一种基于检索增强生成 (RAG) 的方法,它利用超图 (hypergraph) 来更全面地捕捉领域知识中的复杂关系,从而提高大型语言模型 (LLM) 的性能并减少幻觉。
核心思想:
传统的 RAG 方法通常使用向量相似性来检索相关文档,而 Hyper-RAG 则通过超图来建模知识。超图可以表示实体之间的超越成对关系,相比于传统图结构,它能更好地保留信息,更准确地找到与问题相关的上下文。
地址:https://github.com/iMoonLab/Hyper-RAG
✨ 5: Browserbase MCP Server
Browserbase MCP Server利用云端浏览器自动化能力,使LLM能与网页互动、截图并执行JavaScript。

Browserbase MCP Server 是一个基于 Model Context Protocol (MCP) 的云服务,旨在帮助大型语言模型 (LLM) 应用程序无缝集成外部数据源和工具,尤其是Web浏览器。它利用 Browserbase、Puppeteer 和 Stagehand 的能力,允许 LLM 在云端控制浏览器,执行诸如网页交互、数据提取、截图、执行JavaScript等操作。
地址:https://github.com/browserbase/mcp-server-browserbase
(文:每日AI新工具)