1.4k星!火爆的小智机器人python版来了!没有硬能轻松体验AI强大功能语音助手
py-xiaozhi 是一个基于Python实现的小智语音客户端,支持AI语音交互、多模态交互、智能家居控制等特性。兼容多种操作系统,并提供了丰富的IoT设备集成功能。
py-xiaozhi 是一个基于Python实现的小智语音客户端,支持AI语音交互、多模态交互、智能家居控制等特性。兼容多种操作系统,并提供了丰富的IoT设备集成功能。
Toolkami 是一个极简的 AI Agent 框架,仅需七种核心工具即可运行。它支持 Turbo 模式和热重载功能,具有高效的模块化设计、实时通信机制和自主决策机制等特点。
simple-subtitling 是一个生成包含演讲者ID和时间戳的音频字幕项目,支持多种语言,通过音频样本指定演讲者身份,并使用先进算法实现高精度语音识别和聚类。
AI Manus 是一个通用 AI Agent 系统,支持在沙盒环境中运行各种工具和操作。项目通过 Docker 和 Docker Compose 部署,并使用 OpenAI API 和 GPT 模型。
MAGI-1是SandAI-org开发的开源视频生成模型,具有高时间一致性和流式生成能力。它支持多种任务并采用先进的架构和技术以提升生成效率。
MiniMax发布的新模型MiniMax-Speech通过可学习的说话人编码器和Flow-VAE架构提高了文本转语音的质量与保真度,在零样本情况下实现了跨语言合成,多项测试中表现优异。