OpenAI 发布新一代音频模型 API:打造更智能的语音助手

2025年3月,OpenAI发布新一代音频模型API,包括改进的语音转文本和文本转语音模型。新模型在准确性和噪声消除方面表现出色,并提供更强的可控性定制选项。开发者可通过API和集成的Agent SDK轻松访问这些功能。

一款刚刚开源的TTS语音模型!25ms超低延迟支持实时对话,4种规格适配全场景!

Orpheus TTS 是一款全新的开源 TTS 模型,支持接近人类的自然情感表达、超低延迟(25-50毫秒)以及强大的零样本语音克隆功能。该模型提供从 150M 到 3B 参数四种不同规模的选择。

MCP生态一发不可收拾,通过MCP服务器把Figma设计稿传到Cursor等AI编程工具。

通过Figma-Context-MCP项目,用户可将设计稿直接传递给AI编码工具Cursor生成代码。该项目简化和转换Figma API数据,确保只传递最相关的布局和样式信息,提高AI的准确性和响应的相关性。