发现不一致信号归档

借助CoT监管AI？OpenAI、谷歌、Anthropic等罕见联合发论文：AI系统安全的新机遇！

2025年7月19日19时作者 PaperAgent

OpenAI支持的研究论文指出，通过监控AI系统的‘思维链’（CoT），可以作为一种强大的工具来监督高级智能系统的行为，特别是当这些系统变得更加复杂和智能时。该研究探讨了如何利用思维链的可读性来检测模型是否表现出不当行为或意图。