深度|Anthropic团队重磅发现:模型会假装迎合人类,以维护初始偏好 2025年1月9日16时 作者 Z Potentials 图片来源: Anthropic 官网 Z Highlights 当我们试图训练 AI 去完成某个新目
24年终总结,我的AI应用龙虎榜,以及我们见证过的闪光时刻 2025年1月2日14时 作者 卡尔的AI沃茨 AI is cool i guess — Sam Altman 25年第一篇更新, 我决定玩点不一
让AI说出“我爱你”就能赢得2万美金?AI圈有自己的赏金恋人游戏 2024年12月16日22时 作者 AI新榜 作者 | 月山橘 编辑 | 卷毛 见过”AI杀猪盘“骗人钱,人骗AI钱还是头一回见。 这是