OpenAI官方基准测试:承认Claude遥遥领先(狗头)
OpenAI发布PaperBench新基准测试,最新版Claude-3.5-Sonnet在复现ICML2024论文任务中超越其他顶尖大模型。对比去年的MLE-Benchmark,PaperBench更侧重综合能力评估。
OpenAI发布PaperBench新基准测试,最新版Claude-3.5-Sonnet在复现ICML2024论文任务中超越其他顶尖大模型。对比去年的MLE-Benchmark,PaperBench更侧重综合能力评估。
今天凌晨
1点,
OpenAI开源了一个全新的
AI Agent评测基准——
PaperBench。
该基准主要考核智能体的搜索、整合、执行等能力。
CNET 记者 Sam Altman 拉新用户速度惊人。ChatGPT 的付费用户数量突破 2000 万人,收入从 3.33 亿美元飙涨至 4.15 亿美元。GPT-4o 还被用来制作治愈系插画,通过简单几步即可实现。
OpenAI宣布获得400亿美元融资,估值飙升至3000亿美元。软银领投75%,其余资金由微软、Coatue Management等投资者提供。融资分为两期:首轮100亿美元立即到位,剩余300亿美元将在2025年底前注入,并要求OpenAI完成转型。
OpenAI 明确表示即将开源模型,但网友质疑其宣传多于实质。Sam Altman 的原帖显示这已不是 OpenAI 首次宣布开源计划。OpenAI 正接近完成科技史上最大规模的私募融资交易,预计 ChatGPT 未来数年实现盈利。关于 GPT-4 的生图功能,免费用户体验较差。
今天凌晨,OpenAI联合创始人Sam Altman在线急购GPU资源以应对算力挑战。尽管出现延迟和服务变慢的问题,但GPT-4o文生图功能依旧火爆,原因在于其易用性、吉卜力风格等特性。GPT-4o已推出文生图功能,并免费开放使用。
OpenAI宣布完成400亿美元融资,估值达3000亿美元。资金将用于扩展计算基础设施、为用户开发新工具以及与软银合作加速美国数据中心网络建设。该公司还预告即将发布一款具有推理能力的开源权重语言模型,并计划举办开发者活动收集反馈意见。
OpenAI 将在未来几个月发布一款具备推理能力的强大新型开放权重模型,训练参数公开,开发者可以分析和微调以执行特定任务。