前OpenAI CTO 成立思维机器实验室

专注AIGC领域,文章介绍了新成立的思维机器实验室及其三大研究方向:调整AI系统满足需求、开发坚实基础构建更强系统以及培养开放科学文化。强调弥合人工智能理解和应用之间的差距,并提出一系列举措推动科技进步和安全措施。

Claude挣钱强于o1!OpenAI开源百万美元编码基准,检验大模型钞能力

OpenAI 推出并开源 SWE-Lancer 基准测试,用于评估 AI 大模型在现实世界软件工程任务中的表现。包含 1400 多个自由软件工程任务,总价值 100 万美元。包括自家 GPT-4o、o1 和 Anthropic Claude 3.5 Sonnet 在内的前沿模型未能解决大多数任务,仅 Claude 3.5 Sonnet 拿到最高报酬 403,325 美元。