开源
android-mcp-server:通过ADB实现对Android设备的程序化控制,轻松管理设备操
Android MCP Server利用ADB实现设备控制,支持自动和手动选择,提供截图、UI分析等功能,适配多种场景,与MCP客户端无缝对接。
轻量级语音模型Vui开源,支持本地部署,笑声停顿全拟真,4万小时练出人类对话感!
近日,Fluxions-AI团队开源了一款轻量级设备端语音对话模型Vui,能够生成流畅且逼真的自然对话,并模拟语气词、笑声和犹豫等非语言元素,适用于智能助手、播客生成及客服AI等多种场景。
语音驱动的多人对话视频生成MultiTalk,AI智能体个性化记忆操作系统
五个项目介绍:Let Them Talk(语音驱动多人对话生成)、MemoryOS(个性化AI代理内存操作系统)、Gemini MCP Server for Claude Code(Claude增强服务器)、Spy Search(开源智能搜索框架)和ZIN MCP Client(轻量级CLI MCP客户端),涵盖多模态内容生成、AI交互控制、代码审查与分析等多个领域。
AI Screenshot Translator:简单实用的截图翻译工具
GitHub 上的 AI Screenshot Translator 是一款实用工具,用于翻译图像中的文本,支持 PDF 数学公式和多窗口管理,可通过自定义快捷键一键截图并翻译。
Awesome-Multimodal-LLM-for-Code:专注于多模态场景下代码生成的资源库
Awesome-Multimodal-LLM-for-Code:整合多种多模态代码生成资源的优秀库,涵盖Web前端、科学绘图等场景,提供高质量论文和数据集,并持续更新。