OpenAI 归档 - 第59页共137页

OpenAI官方基准测试：承认Claude遥遥领先（狗头）

2025年4月3日11时作者量子位

OpenAI发布PaperBench新基准测试，最新版Claude-3.5-Sonnet在复现ICML2024论文任务中超越其他顶尖大模型。对比去年的MLE-Benchmark，PaperBench更侧重综合能力评估。

2025年4月3日11时作者新智元

enAI最新框架PaperBench正为此生，让AI智能体从头开始复现ICML 2024 20篇优秀

2025年4月3日8时作者 AIGC开放社区

今天凌晨
1点，
OpenAI开源了一个全新的
AI Agent评测基准——
PaperBench。
该基准主要考核智能体的搜索、整合、执行等能力。

2025年4月2日14时作者 AI信息Gap

OpenAI 明确表示即将开源模型，但网友质疑其宣传多于实质。Sam Altman 的原帖显示这已不是 OpenAI 首次宣布开源计划。OpenAI 正接近完成科技史上最大规模的私募融资交易，预计 ChatGPT 未来数年实现盈利。关于 GPT-4 的生图功能，免费用户体验较差。

2025年4月2日8时作者 AIGC开放社区

今天凌晨，OpenAI联合创始人Sam Altman在线急购GPU资源以应对算力挑战。尽管出现延迟和服务变慢的问题，但GPT-4o文生图功能依旧火爆，原因在于其易用性、吉卜力风格等特性。GPT-4o已推出文生图功能，并免费开放使用。

2025年4月1日23时作者头部科技

OpenAI宣布完成400亿美元融资，估值达3000亿美元。资金将用于扩展计算基础设施、为用户开发新工具以及与软银合作加速美国数据中心网络建设。该公司还预告即将发布一款具有推理能力的开源权重语言模型，并计划举办开发者活动收集反馈意见。

2025年4月1日23时作者乌鸦智能说

朱啸虎近期言论引发热议，文章分析了AI应用缺乏壁垒的现象，并提出文化认同和用户数据是建立护城河的关键因素。

2025年4月1日23时作者机器之心

OpenAI 将在未来几个月发布一款具备推理能力的强大新型开放权重模型，训练参数公开，开发者可以分析和微调以执行特定任务。