OpenAI放大招!BrowseComp来了,AI上网能力大比拼! 上午11时 2025/04/11 作者 AGI Hunt OpenAI发布了全新基准测试BrowseComp,专为评估AI代理在互联网上寻找难以获取信息的能力而设计。该测试包含1266个难题,其中大多数人类也需要花费两小时才能解决。