1秒转录1小时音频,英伟达重磅开源语音识别最强模型Parakeet!
Nvidia开源最新语音识别模型Parakeet TDT 0.6B,能在1秒内完成60分钟音频转录,并以CC-BY-4.0许可协议开放源代码。该模型在Open ASR排行榜上表现优异,RTFx性能达到3380倍。
Nvidia开源最新语音识别模型Parakeet TDT 0.6B,能在1秒内完成60分钟音频转录,并以CC-BY-4.0许可协议开放源代码。该模型在Open ASR排行榜上表现优异,RTFx性能达到3380倍。