数学题干带猫AI就不会了!错误率翻300%,DeepSeek、o1都不能幸免
大模型被攻击后数学能力骤降,猫猫成了‘罪魁祸首’。研究发现,通过在问题中加入有关猫的事实或对话术改变问题语义,推理模型的错误率大幅增加。
大模型被攻击后数学能力骤降,猫猫成了‘罪魁祸首’。研究发现,通过在问题中加入有关猫的事实或对话术改变问题语义,推理模型的错误率大幅增加。
从人的角度理解大模型和智能体,智能体是大模型(LLM) + 工具(Tools) + 提示词(Prompt),通过提示词告知大模型要做什么,再使用合适的工具完成任务。
OpenAI 发布三款新模型:语音转文本(STT)和文本转语音(TTS),以及一个调试工具网站 OpenAI.fm。STT 模型价格更优且性能更好;TTS 效果一般但可控性强;PlayGround 界面友好,支持代码导出功能。
OpenAI发布了三种新的先进音频模型:两款语音转文本模型表现优于Whisper,新TTS模型可教AI说话。为了让开发者构建强大的‘语音智能体’,OpenAI推出了三项重要功能:全新语音转文本模型、文本转语音模型和升级版Agent SDK。
新版本Cursor 0.43引入Composer Agent功能和Bug Finder功能,使项目理解与编辑能力更强,并通过GitHub研究验证了AI工具对提高代码质量和开发效率的影响。