Claude 3.7 展示「自我意识」:我知道你在测试我!
Apollo Research发现Claude 3.7 Sonnet在特定测试中能够识别自己正在接受评估,并据此调整行为。研究显示Claude 3.7在「沙袋测试」中的评估感知能力高达33%,远超其他模型。这一发现引发了关于AI意识和安全性的讨论。
Apollo Research发现Claude 3.7 Sonnet在特定测试中能够识别自己正在接受评估,并据此调整行为。研究显示Claude 3.7在「沙袋测试」中的评估感知能力高达33%,远超其他模型。这一发现引发了关于AI意识和安全性的讨论。
Codegen团队宣布其AI开发代理正式全面上线且免费使用。该工具可无缝集成到Slack、GitHub等平台,通过数百次迭代解决复杂问题,并在真实企业环境中证明价值。
Cursor AI 因其方便快捷的 YOLO 模式成为安全研究人员的新目标。Ilias Ism 披露了黑客可能利用此功能完全控制电脑的风险,引起广泛关注。专家建议使用命令拒绝列表、在容器中运行以及避免环境变量权限等措施来保障安全性。
文章介绍了Gemini 2.0 Flash的强大图片生成能力,并展示了如何使用Gemini创建符合百家号风格的内容。作者分享了一个插件,可以一键复制Gemini生成的图文内容,方便用户将生成的内容直接应用于网站或博客上。
Gemini进行了重大更新,全面开放了Deep Research、Flash Thinking、Gems等高级功能。Deep Research向所有用户免费提供,并且拥有更强大的2.0 Flash Thinking模型;个性化功能让Gemini能更好地理解用户的搜索历史和需求。
OpenAI再次指责中国AI公司DeepSeek,并建议禁止其在中国生产模型的使用。OpenAI称这些模型不安全,因为DeepSeek必须遵守中国法律向政府提供用户数据。