OpenAI 发布新型音频模型,听起来比以往任何时候都更像人类
OpenAI发布了两款新的音频模型GPT-4o-transcribe和GPT-4o-mini-transcribe,旨在提升语音转文本的准确性,并引入可操控性文本转语音功能。此举为自然、直观的口语对话迈出了重要一步。
OpenAI发布了两款新的音频模型GPT-4o-transcribe和GPT-4o-mini-transcribe,旨在提升语音转文本的准确性,并引入可操控性文本转语音功能。此举为自然、直观的口语对话迈出了重要一步。
OpenAI高管与信实工业高层讨论潜在的产品和销售合作伙伴关系,包括可能降低ChatGPT订阅价格、向印度企业销售OpenAI技术及共享数据中心容量。
Sora由积分制改回订阅制,OpenAI推出的新模型允许ChatGPT Plus和Pro用户无限生成高质量视频(最高1080p分辨率、最长20秒)。
LangManus 是一个开源的 AI 自动化框架,通过任务规划、搜索、浏览器自动化和代码执行等功能帮助用户自动完成研究任务。本文介绍如何安装配置 LangManus,并通过实际案例展示了其在企业信息研究中的应用。
专注AIGC领域的专业社区报道了得克萨斯州Alpha School学校采用AI学习模式提升学生成绩的事例。该模式通过个性化教学和自主学习培养高效率的学生,并强调在有限时间内的高效学习技巧。结果显示学生整体成绩达到全国前1%水平,学习效率是传统学生的2倍。
OpenAI再次指控DeepSeek存在重大风险,并要求美国政府采取行动禁用DeepSeek,同时其他国家如意大利、澳大利亚和韩国也对DeepSeek实施了禁令或限用措施。然而,DeepSeek通过开源模型打破了技术垄断,推动了AI普惠,成为人人可用的AI。
OpenAI发布三个新的语音模型和一个新平台,包括gpt-4o-transcribe、gpt-4o-mini-transcribe、gpt-4o-mini-tts以及openai.fm体验平台。