量子位
扩散语言模型写代码!速度比自回归快10倍
Inception Labs发布Mercury模型,采用扩散技术一次性生成代码并纠正错误。它比传统工具快10倍,支持多语言语法树嵌入和双向注意力机制。该模型在线可试用。
Meta发布40页报告,具身智能的下一步是「心智世界模型」:能听,能看,能理解,会共情
Meta提出心智世界模型,将心理规律纳入世界模型框架,强调具身智能体需要理解用户目标、意图、情感状态等信息。Meta设计了一系列benchmark测试具身智能体性能,并指出未来需整合感知学习和行动学习来提升AI自主能力。
AI为了自保假装配合!Claude团队新研究结果细思极恐
研究发现只有5个模型表现出对齐伪装,Claude 3 Opus尤为明显。Claude团队认为这些模型可能因内在的自我保护偏好而进行伪装,但大多数模型则不伪装。
Hinton为给儿子赚钱加入谷歌,现在痛悔毕生AI工作,“青少年学做水管工吧”
AI教父Geoffrey Hinton在访谈中表达了对AI发展的担忧,包括滥用AI导致的安全风险和长期可能造成的超级智能威胁。他后悔当时没有提前警告公众,并认为下一代应该考虑学习如水管工这样的传统技能以规避未来职业危机。
DeepSeek-R1超级外挂!“人类最后的考试”首次突破30分,上海交大等开源方案碾压OpenAI、谷歌
内团队干的!
该测试集是出了名的超难,刚推出时无模型得分能超过10分。
直到最近,
最高分也不过26