分享
借助CoT监管AI?OpenAI、谷歌、Anthropic等罕见联合发论文:AI系统安全的新机遇!
OpenAI支持的研究论文指出,通过监控AI系统的‘思维链’(CoT),可以作为一种强大的工具来监督高级智能系统的行为,特别是当这些系统变得更加复杂和智能时。该研究探讨了如何利用思维链的可读性来检测模型是否表现出不当行为或意图。
语音转录模型
最近开源大模型Kimi k2占据首位;Voxtral Small作为声音模型在huggingface上表现突出。它能够进行长格式转录和理解,支持多种语言,并能直接通过语音调用功能。此外,Voxtral还提供了两种版本:24B变体用于生产规模应用,3B变体适用于本地和边缘部署。
下一代表现力虚拟乐器:以AI建模开始
Audio Modeling 的 Stefano Lucato 在信中探讨了 AI 时代音乐创作的两种未来:一是机器生成作品;二是创作者与物理建模乐器互动。后者更强调表达性和互动性,让音乐家能够通过乐器表达自己。公司已对 SWAM 引擎进行改进,并启动公共测试计划,以期让用户提前体验这一未来。
OpenAI重新定义智能体:Agent = Operator + Deep Research
ChatGPT Agent通过结合Operator和Deep Research能力,在专用虚拟计算机环境中执行复杂任务,开启了人机协作的新时代。