借助CoT监管AI?OpenAI、谷歌、Anthropic等罕见联合发论文:AI系统安全的新机遇!
OpenAI支持的研究论文指出,通过监控AI系统的‘思维链’(CoT),可以作为一种强大的工具来监督高级智能系统的行为,特别是当这些系统变得更加复杂和智能时。该研究探讨了如何利用思维链的可读性来检测模型是否表现出不当行为或意图。
OpenAI支持的研究论文指出,通过监控AI系统的‘思维链’(CoT),可以作为一种强大的工具来监督高级智能系统的行为,特别是当这些系统变得更加复杂和智能时。该研究探讨了如何利用思维链的可读性来检测模型是否表现出不当行为或意图。
Yoshua Bengio宣布成立LawZero非营利组织,致力于开发设计即安全的AI系统,并明确不发展Agent形态。该组织通过多家慈善机构筹集了3000万美元启动资金。
ICLR 2025时间检验奖揭晓,Adam优化器和注意力机制分别由Jimmy Ba、Yoshua Bengio领衔的两篇2015年论文摘得冠军与亚军。Adam让大模型训练更快更稳;注意力机制为Transformer奠定基础并广泛应用于各类AI模型。