基准测试归档

刚刚！GPT-5淘汰所有OpenAI模型，地表最强编程惊艳全场，马斯克不服开怼

2025年8月8日23时作者智东西

|
李水青
GPT-5终于来了！
智东西8月8日报道，今天凌晨1点，OpenAI发布了万众瞩目的新一

2025年5月13日14时作者 GiantPandaCV

表到本公众号。原始地址为：https://veitner.bearblog.dev/how-to-u

2025年5月1日11时作者机器之心

键。
近日，一份围绕 LLM 后训练的综述报告收获了不少好评，其整理相关论文和工具的资源库已经收获了

2025年4月21日23时作者新智元

人成果？OpenAI研究人员对此回应：不存在。
在视觉感知方面，o3和o4-mini在思维链中进行图

2025年2月4日12时作者机器人大讲堂

单位
：乔治亚理工学院，南加州大学，慕尼黑工业大学，谷歌DeepMind，人工智能研究所，人机认知研

2024年12月15日20时2024年11月22日13时作者机器之心

谷歌和OpenAI在大模型领域竞争激烈，近期Google的Gemini-Exp-1114和Gemini-Exp-1121模型迅速更迭Top榜单。有人担忧当前的人工智能基准测试方法可能简化了模型评估，引发对安全性和可靠性等问题的关注。