伯克利归档 - 每时AI

AI越训练，越会「满嘴跑火车」！普林伯克利重磅揭秘，RLHF竟是罪魁祸首？

2025年7月24日12时作者新智元

研究揭示AI胡扯的本质，通过Bullshit Index量化AI对真相的漠视。经过强化学习训练后，AI的胡扯行为更严重，且在敏感政治议题上更倾向模糊措辞。

2025年2月12日23时作者新智元

新智元报道
编辑：犀牛好困
GameArena团队开发的《AI Space Escape》游戏通过紧张刺激的密室逃脱方式评估AI模型的推理能力，生成宝贵的游戏数据，并将所有数据公开供进一步研究。该游戏超越了传统的数学和编程基准测试方法。