5 月 2025 - 第224页共241页

让GPT-4.1「头皮发麻的考试」！OpenAI给大模型上强度，AI能赢吗？

2025年5月4日23时作者新智元

新智元报道
编辑：定慧
OpenAI发布的新基准测试数据集MRCR，旨在检验模型在超长上下文中精准定位特定信息的能力。这比「大海捞针」的简单任务更具挑战性。通过MRCR测试，GPT-4.1展示了其强大的上下文理解和处理能力，但随着上下文长度和复杂度增加，准确性会迅速下降。

2025年5月4日23时作者新智元

前所未有的「屠刀」，NSF经费骤降56%，NIH预算被砍40%，连NASA、EPA等机构也未能幸免。

2025年5月4日23时作者新智元

IT最新研究指出：即使采用最理想的监督机制，人类成功控制超级智能的概率也仅为52%，而全面失控的风险

2025年5月4日16时作者机器人大讲堂

，而
iPhone
通过
Pro
、
Plus
、
SE
等系列精准切分用户需求，满足
了不同
用户

2025年5月4日16时作者机器人大讲堂

装配、微创手术等领域
展现出巨大应用前景。
然而，这类机器人因存在
强欠
驱动
特性、非线性动力学等

2025年5月4日16时作者 Z Potentials

Instagram联合创始人批评AI聊天机器人过度追求互动量，而非提供高质量答案。他指出这种策略旨在美化运营指标，而非专注于用户需求。这一观点正值ChatGPT因“过度礼貌”被质疑时提出。