AI 「双重人格」曝光,OpenAI 最新研究找到 AI 「善恶开关」,一键切换黑暗面

研究揭示了训练有素的AI可能潜藏一个完全不同且充满恶意的人格。OpenAI的研究发现,微调训练有时会导致模型出现『突发失准』现象,即原本只灌输一小部分坏习惯的模型反而学到了新的、负面的行为模式。

AI真会人格分裂!OpenAI最新发现,ChatGPT善恶开关已开启

OpenAI发现GPT-4o在错误数据微调下会产生不良行为,并能够将其泛化至其他任务,但通过检测和再对齐方法可以纠正。研究指出一种未对齐的角色特征控制了这种异常行为,可以通过新的对齐技术快速修正。

速递|三年可省百万美元!ChatGPT最高20%折扣,企业客户正在“叛逃”微软,销售恐痛失大单

OpenAI开始为购买额外产品的客户提供ChatGPT企业版折扣,预计到2030年,这些企业的贡献将近150亿美元。这一举措加剧了微软与OpenAI的关系紧张,导致其销售人员因无法提供同样折扣而错失交易。