每日AI新工具，作者每时AI

将论文自动转换为可运行的代码Paper2Code，Kimi开源音频基础模型，DeepWiki为github项目创建深度分析

2025年4月27日11时作者每日AI新工具

Paper2Code 是一个多智能体系统，将机器学习论文转换为可运行的代码仓库；Kimi-Audio 是一个开源音频模型，擅长理解、生成和对话任务；LangGraph WhatsApp Agent 利用 LangGraph 和 Twilio 构建 AI 代理处理 WhatsApp 消息；Trackers 是一个统一库，提供多种目标追踪算法与不同对象检测器集成；DeepWiki 利用 AI 自动生成 GitHub 代码仓库的交互式深度文档。

OpenAI发布GPT-image-1的api拥有更强的灵活性吉卜力模式更方便，腾讯开源定制化角色生成插件

2025年4月24日11时作者每日AI新工具

GPT-image-1 是 OpenAI 最新、最先进的图像生成模型，支持高级定制和多种艺术风格。InstantCharacter 仅需单张图片即可个性化角色生成，适用于各种下游任务。Cooragent 提供智能体协作平台，简化复杂任务完成流程。Austen 利用 AI 和 Mermaidjs 分析书籍角色关系并可视化。Describe Anything 模型能生成图像/视频特定区域的详细描述，并发布新的评估基准。

Manus余温未退Suna开源平替，实时AI语音玩具，LLM增强Playwright的智能浏览器自动化工具

2025年4月23日11时作者每日AI新工具

本文介绍了五款AI工具：Suna提供研究和数据分析功能；ElatoAI支持实时语音对话；Hyperagent增强Playwright的智能浏览器自动化；Hyper-RAG利用超图提高LLM性能；Browserbase MCP Server则通过云端浏览器自动化能力提升大型语言模型的功能。

Nari Labs开源文本转语音模型生成逼真对话并支持情感控制，开源命令行AI助手，供数百个MCP服务器的容器化版本每天自动更新

2025年4月22日11时作者每日AI新工具

近期分享了五款AI技术产品：Dia文本转语音模型、SkyReels V2无限长度电影生成器、Open Codex命令行AI助手、NodeRAG异构图检索增强生成系统以及MCP Containers容器化MCP服务器。

连接 GSC、Ads和Claude AI通过自然语言对话分析网站数据提升优化效率，检测照片中的特定人脸并通知指定联系人

2025年4月21日16时作者每日AI新工具

mcp-agent基于MCP协议简化智能代理构建；DocAgent利用多智能体和分层处理自动生成高质量Python文档字符串；Google Search Console MCP server连接GSC和Claude AI提升SEO效率；Google Ads MCP通过自然语言对话分析广告数据优化效果；Find My Kids利用WhatsApp检测特定人脸并通知指定联系人。

openai开源文本转语音框架OpenAI.fm，谷歌清晨发布Gemini 2.5 Flash preview，

2025年4月18日11时作者每日AI新工具

OpenAI.fm、Python A2A、LLManager、Together Open Deep Research、Gemini Coding Agent 和 Gemini 2.5 Flash 等创新项目介绍。

谷歌最先进的视频生成模型Veo 2，使用自然语言查询终端命令，将多种Agent框架转换为MCP服务器工具

2025年4月16日11时作者每日AI新工具

谷歌最先进的视频生成模型Veo 2能将文本、图像或两者结合转化为八秒的视频，它擅长理解简单和复杂指令，并准确模拟现实世界的物理规律。开发者可以通过Google AI Studio、Gemini API等平台使用Veo 2的核心功能包括文本到视频和图像到视频。同时介绍Python工具Zev用于自然语言查询终端命令、VS Code扩展RooFlow增强AI辅助开发、实时会议转录APIVexa支持多种平台并提供企业级安全保障的工具automcp。

Windsurf 上未来一周免费无限使用 GPT-4.1，开源高效的浏览器智能体，开源的 AI 视频笔记生成工具

2025年4月15日11时作者每日AI新工具

文章介绍了多个AI工具和项目，包括Index开源浏览器代理、Awesome GPT-4o Images精选图像生成案例集、BiliNote视频笔记生成工具、any-agent统一接口访问多种Agent框架库、Agentic RAG基于代理的RAG系统以及Windsurf提供的免费GPT-4.1使用权。

Claude Code的开源替代OpenCoder，AI Agent驱动的Web测试框架Magnitude，

2025年4月14日11时作者每日AI新工具

OpenCoder是基于Vercel AI SDK的开源替代品，提供跨平台支持和MCP功能。LINE Bot MCP Server实现模型上下文协议（MCP），连接AI代理至LINE官方账号。Saiki利用自然语言控制工具和服务，简化自动化工作流程。Magnitude作为Web测试框架，通过视觉AI适应界面变化。Hi3DGen从2D图像生成高保真3D几何体，克服现有方法的局限性。

Openai发布Agent基准测试，小米开源自动驾驶框架，字节跳动发布Seed-Thinking-v1.5技术细节

2025年4月11日11时作者每日AI新工具

文章介绍了五个项目或工具：BrowseComp、ReCamMaster、ORION、Seed-Thinking-v1.5 和 Agent-Wiz。它们分别专注于AI代理的浏览能力、视频生成、自动驾驶以及智能体的工作流安全评估等方面，涵盖了机器学习和人工智能领域的多个方向。

2026 年 1 月
一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31