英伟达开源语音识别模型!0.6B 参数登顶 ASR 榜单,1 秒转录 60 分钟音频!

英伟达发布Parakeet TDT 0.6B V2开源语音识别模型,参数仅600M,平均词错误率(WER)6.05%,可在1秒内完成60分钟音频转录,支持英文,已入驻Hugging Face Open ASR榜单首位。

开源!使用AI模型控制安卓设备,真正的智能机不只是“Hey Siri”。

今天分享的DroidRun是一个基于大语言模型的开源框架,用于通过自然语言命令控制Android设备。它支持多种LLM,并结合DroidRun Portal应用实现自动化操作,如购物助手、社交媒体发布等。

DeepWiki开源平替为GitHub自动创建Wiki文档,会议信息助你充分准备会议,将MCP工具集成到ChatGPT等AI平台

DeepWiki 是一款 AI 驱动的工具,能为 GitHub 等代码仓库自动创建精美、交互式 Wiki 文档;Meeting Prep Agent 利用 Tavily 的高级搜索功能和 Google Calendar 集成帮助用户准备会议;SuperCoder 是一个在终端中运行的编码助手,具备代码搜索、编辑等多功能;MCP SuperAssistant 是一款 Chrome 扩展程序,集成 MCP 工具增强 AI 助手能力;MiMo 是小米开发的一系列预训练和后训练策略优化的大语言模型。