一款开源的语音对话助手:百聆,通过ASR+LLM+TTS实现,时延800ms

一款开源的语音对话助手:百聆,通过ASR+LLM+TTS实现,时延800ms,低配置也可运行,支持打断。无需GPU,通过优化,可本地部署,仍能提供类GPT-4的性能表现。模块化设计,ASR、VAD、LLM和TTS模块相互独立,可以根据需求进行替换和升级。支持记忆功能,具备持续学习能力,能够记忆用户的偏好与历史对话。

参考文献:
[1] github:https://github.com/wwbin2017/bailing
[2] bailing 实时对话:https://www.zhihu.com/zvideo/1818994917940260865


(文:NLP工程化)

《一款开源的语音对话助手:百聆,通过ASR+LLM+TTS实现,时延800ms》有1条评论

  1. 开源党的新成员,性能远超预期!ASR+LLM+TTS的强大组合,低配置也能轻松运行,就是支持打断有点不厚道

    回复

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往