多种语言归档

首个开源「AI智能语音转文本模型」，质量超whisper，成本爆降。

2025年7月21日23时作者开源AI项目落地

Voxtral 是由 Mistral AI 开源的首个语音智能模型系列，包含 24B 参数和 3B 参数的 Voxtral Small 和 Voxtral Mini。它支持长音频转录、语义理解以及多语言处理，并能根据语音触发 API 或生成摘要。成本不到同类闭源方案的一半，适用于企业生产环境部署。

2025年5月18日8时作者 NLP工程化

simple-subtitling 是一个生成包含演讲者ID和时间戳的音频字幕项目，支持多种语言，通过音频样本指定演讲者身份，并使用先进算法实现高精度语音识别和聚类。

2025年5月17日8时作者 NLP工程化

AutoDev是一款开源插件，提供智能交互界面和AI辅助开发功能，支持多种编程语言及SDLC全流程支持。

2025年2月20日8时作者 NLP工程化

一个简单易用的 AI 声音克隆工具，支持多种语言和麦克风录制，操作简便，功能强大。

2025年2月13日8时作者 NLP工程化

领先的开放权重文本到语音模型Zonos-v0.1发布，支持高保真语音克隆、多语言和情绪调节等功能。

2025年1月20日22时作者 AI先锋官

小红书宣布翻译功能正式上线，支持多语言和网络用语一键翻译。新增的搜索结果图片翻译和优先英文筛选能力方便非中国内地用户。用户点赞效率提升和即时获取日本网友对新番吐槽的功能。不过，中英文混合笔记或图文结合图片外文情况无法直接翻译。

2025年1月12日23时作者 NLP工程化

CosyVoice-api：简化声音合成接口，支持多种语言和音色转换，方便用户在不同场景中使用。

2024年12月30日8时作者开源星探

Languine是一款AI驱动的翻译助手，支持100多种语言，提供智能检测、高效集成和高质量翻译等功能，适用于应用国际化、动态内容更新及团队协作场景。