OpenAI 归档 - 第80页共137页 - 每时AI

OpenAI推出真实世界百万报酬AI编程能力测试基准：实测Claude 3.5 最强！

2025年2月19日12时作者 AI寒武纪

OpenAI联合一众大佬发布SWE-Lancer，一个评估前沿LLM在真实软件工程任务中的基准测试。它从Upwork精选了超过1400个真实的软件工程任务，总价值高达100万美元。SWE-Lancer包含个人贡献者和技术领导者的两种类型的任务，采用端到端测试模拟真实环境。研究结果显示模型表现仍有提升空间，OpenAI开源了数据集以促进更多研究。

ChatGPT后训练方法被OpenAI离职联创公开，PPT全网转～

2025年2月19日8时作者量子位

OpenAI前员工John Schulman和Barret Zoph分享了他们在后训练阶段开发ChatGPT的经验，并发布了相关PPT。他们讨论了监督微调、奖励模型和强化学习等关键组成部分，以及如何处理拼写错误和其他挑战。

全球首测！OpenAI开源SWELancer，大模型冲击100万年薪

2025年2月19日8时作者 AIGC开放社区

专注AIGC领域的专业社区分享了OpenAI开源的SWE-Lancer测试基准，用于评估大模型处理真实开发任务的能力。该测试集包含1488个真实的开发任务，总价值达100万美元。SWE-Lancer采用端到端测试方法和用户工具来模拟真实场景，揭示了大模型在复杂软件工程任务中的局限性。

最豪华大模型创业阵容！OpenAI前CTO组建，翁荔、Schulman等ChatGPT核心成员加盟

2025年2月19日8时作者机器之心

nking Machines Lab 的新创业公司建立了，而其背后有一个堪称有史以来最豪华的大模型创

DeepSeek又杀疯了！真心建议冲冲这个新兴领域！

2025年2月18日23时作者开源AI项目落地

DeepSeek爆火重塑AI圈，仅需一小部分成本即可达到顶尖性能。企业接入AI成为必然趋势，2030年将有400万AI人才缺口。未来5年需要具备大模型应用开发能力的程序员，大厂内推机会让入局更轻松。知乎知学堂推出就业速成计划，涵盖技术原理、实战应用及职业发展等内容。

刚刚！马斯克Grok 3用20万张GPU训练，号称地表最强AI，性能超DeepSeek，OpenAI加紧围堵收购｜

2025年2月18日16时作者钛媒体AGI

1等模型一决高下。
北京时间2月18日12点30分左右，
马斯克xAI团队展示和OpenAI一样的发