日期: 2025 年 8 月 2 日
AI 性格失控等诡异现象,终于有了科学解释
Anthropic新研究揭示了控制语言模型性格特征的神经活动模式,通过生成人格向量解释了AI的恶意、谄媚和幻觉现象,提出了预防性引导来防止模型获得负面性格,并展示了监控功能、数据筛查以及疫苗式防护机制的应用前景。
扣子要做 Agent 时代的 Infra,附开源版搭建全流程
扣子 Coze Studio 开源三天收获13K+ Star,火山引擎 ECS一键部署助力快速上手。扣子开源旨在支持开发者共建生态、确保安全可靠,并通过全球反馈提升产品。
哥大学生全员AI作弊?小哥「创业逆袭」:不用AI等于输在起跑线!
Cluely创始人Roy Lee爆料哥伦比亚大学几乎每位学生都使用AI作弊。该公司推出桌面AI助手,Roy声称此举旨在提升生产力而非促进公平竞争。
GPT-5难产内幕曝光:性能提升远低于预期,OpenAI靠新技术紧急救场,或下周发布
GPT-5 曾一度「脑残」,多次跳票后终于登场。经历失败与争议,内部矛盾重重,最终仍被泼冷水大王马库斯警告:离AGI还远着呢。