让GPT-4.1「头皮发麻的考试」!OpenAI给大模型上强度,AI能赢吗?

新智元报道
编辑:定慧
OpenAI发布的新基准测试数据集MRCR,旨在检验模型在超长上下文中精准定位特定信息的能力。这比「大海捞针」的简单任务更具挑战性。通过MRCR测试,GPT-4.1展示了其强大的上下文理解和处理能力,但随着上下文长度和复杂度增加,准确性会迅速下降。

AI半壁江山是中国人!黄仁勋敲警钟:美国再不觉醒就晚了

老黄在Hill&Valley论坛上表示,全球50%的人工智能研究人员来自中国,并呼吁美国加速布局AI领域。他预测到本十年末将有至少5000万劳动力缺口,英伟达计划在未来四年内投资超过5000亿美元在美国建设AI基础设施。