AI安全归档 - 每时AI

辛顿上海演讲全文

2025年7月27日14时作者机器学习算法与自然语言处理

MLNLP社区致力于推动国内外机器学习与自然语言处理领域的交流合作。作为知名社区，其愿景是促进学术界、产业界和爱好者之间的进步。近日WAIC大会上，Geoffrey Hinton发表了开幕演讲，讨论了数字智能与生物智能的关系，并分享了他早期模型如何结合两种理论的观点。该文章还提到了大模型的发展以及它们在语言理解方面的应用，强调了人类理解和AI系统之间的一些相似之处。最后讨论了全球合作对于解决AI安全问题的重要性。

AGI真方向？谷歌证明：智能体在自研世界模型，世界模型is all You Need

2025年6月13日16时作者机器之心

发的原点可能在谷歌一篇名为《Attention is All You Need》的论文上。
如今，在

微软发布AI Agent故障白皮书，万字解读各种恶意智能体

2025年6月7日8时作者 AIGC开放社区

gent
出现的各种故障。
这些故障主要分为新型故障和既有故障两大类，并详细解读了出现这些故障的原因

复旦主导，中美等8个国家25家单位44名学者联合发布大模型安全技术综述

2025年2月20日12时作者机器之心

AIxiv专栏发布了一篇系统性技术综述论文《Safety at Scale: A Comprehensive Survey of Large Model Safety》，全面调研了大模型安全领域的390篇研究工作，涵盖6种主流大模型和10种攻击类型。该论文介绍了各类模型的攻击与防御方法，并归纳了常用的数据集和评估基准，总结了4个重要研究趋势及主要挑战，呼吁学术界与国际社会加强合作，共同应对大模型安全问题。