
几年前很多人就在讲端侧没用,现在还会这么认为吗?
不管是苹果三星,还是国产各厂手机,都在搞端侧模型。
还为此特意去了各品牌的线下门店试用了,很多场景根本就没必要联网在云上做,而且端侧才会最大限度保护用户隐私。
现在各手机厂已经做了的端侧模型有不少了,音频转录,TTS,OCR文字识别,大语言模型,图片处理等等。
今天给大家推荐的是MNN TaoAvatar App,阿里做的端侧数字人,目前仅支持Android,IOS估计也很快了。
完全本地,端侧是真的猛。
-
LLM(大型语言模型)
-
ASR(自动语音识别)
-
TTS(文本转语音)
-
A2BS(音频到行为合成)
-
NNR(神经渲染)
扫码加入AI交流群
获得更多技术支持和交流
(请注明自己的职业)


项目简介
MNN TaoAvatar Android 是一个开源本地智能 3D 虚拟形象应用,基于《TaoAvatar》论文实现,能在安卓设备本地运行 LLM、ASR、TTS 等多种模型。其具备对话 AI、语音识别、语音合成等功能,可让用户离线与 3D 虚拟形象畅快聊天。对手机硬件性能要求,需骁龙 8 Gen 3 等旗舰芯片、8GB 以上内存、5GB 以上存储空间。
DEMO

技术特点
模型压缩优化:基于 MNN 引擎,采用量化、剪枝等技术压缩模型体积,提升运行效率。
多模型协同:整合 LLM、ASR、TTS、A2BS、NNR 等多模型,实现端到端流程。
硬件加速:支持 GPU/NNAPI 等异构计算,充分发挥旗舰芯片性能。
轻量化设计:核心模型仅 1.5B 参数,适配移动端资源限制。
离线运行:全流程本地化,无需网络依赖,保障隐私安全。
高效渲染:NNR 神经渲染技术实现表情细节实时生成。
跨平台潜力:基于 MNN 框架,具备向 iOS 等平台扩展的基础。
项目链接
https://github.com/alibaba/MNN/blob/master/apps/Android/Mnn3dAvatar/README.md
关注「开源AI项目落地」公众号
(文:开源AI项目落地)