辛顿上海演讲全文

MLNLP社区致力于推动国内外机器学习与自然语言处理领域的交流合作。作为知名社区,其愿景是促进学术界、产业界和爱好者之间的进步。近日WAIC大会上,Geoffrey Hinton发表了开幕演讲,讨论了数字智能与生物智能的关系,并分享了他早期模型如何结合两种理论的观点。该文章还提到了大模型的发展以及它们在语言理解方面的应用,强调了人类理解和AI系统之间的一些相似之处。最后讨论了全球合作对于解决AI安全问题的重要性。

复旦主导,中美等8个国家25家单位44名学者联合发布大模型安全技术综述

AIxiv专栏发布了一篇系统性技术综述论文《Safety at Scale: A Comprehensive Survey of Large Model Safety》,全面调研了大模型安全领域的390篇研究工作,涵盖6种主流大模型和10种攻击类型。该论文介绍了各类模型的攻击与防御方法,并归纳了常用的数据集和评估基准,总结了4个重要研究趋势及主要挑战,呼吁学术界与国际社会加强合作,共同应对大模型安全问题。

重磅!Anthropic启动AI安全研究员计划,每月1万美元算力预算等你来

Anthropic推出为期6个月的研究员计划,提供丰厚津贴、算力支持及一对一导师指导。研究方向涵盖对抗性鲁棒性与AI控制、可扩展监督等前沿领域,要求参与者具备强大的技术背景和热情的AI安全研究态度。