OpenAI o3 归档 - 每时AI

全球首个科研LLM竞技场上线！23款顶尖模型火拼：o3夺冠，DeepSeek第四

2025年7月11日16时作者新智元

SciArena是首个专为科学文献任务量身定制的大模型评估平台，通过用户投票和分析来测试大语言模型的科研能力。