跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

o3模型

满血o3降智和幻觉倍增的原因可能找到了

2025年4月22日8时 作者 AI寒武纪

OpenAI推出的满血版O3模型在数学基准测试中的成绩被独立测试揭穿为10%,远低于原公布的25%+,揭示了测试环境、数据集以及模型版本差异的影响。

分类 国际、 资讯 标签 10%、 Epoch AI、 FrontierMath、 o3模型、 OpenAI、 数学基准测试 发表评论

o3被曝「无视」前成果?华人学者实名指控,谢赛宁等大牛激烈争辩

2025年4月21日23时 作者 新智元

人成果?OpenAI研究人员对此回应:不存在。
在视觉感知方面,o3和o4-mini在思维链中进行图

分类 资讯 标签 FrontierMath、 o3模型、 优化后、 基准测试、 真实世界、 质疑 发表评论

OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙

2025年4月20日16时 作者 新智元

在一个致命问题:幻觉率高达33%,是o1的两倍。Ai2科学家直指,RL过度优化成硬伤。
满血o3更强

分类 资讯 标签 o3模型、 OpenAI、 RLHF、 半猎豹、 推理任务、 非ASCII连字符 发表评论

它能看图说话、会写代码、还能自己查资料?我测了测 o3,有点可怕

2025年4月19日14时 作者 AI信息Gap

理模型:一个是主打高性能的
o3
,一个是走轻量路线的
o4-mini
。
名字平平无奇,实则大有文

分类 国际、 大模型 标签 o3模型、 创造性写作、 古龙风格、 营销软文、 视觉理解、 逻辑性 发表评论

智商136,o3王者归来!变身福尔摩斯「AI查房」,一张图秒定坐标

2025年4月18日16时 作者 新智元

OpenAI的o3模型在门萨智商测试中得分高达136,能够识别照片拍摄位置并进行复杂图像分析。尽管存在一些视觉推理问题上的不稳定性,但其强大的工程能力和顶尖基础性能使其有望解决这些问题。

分类 资讯 标签 GeoBench评测、 o3模型、 OpenAI、 复杂任务、 瀑布、 识别位置 发表评论

o3全网震撼实测:AGI真来了?最强氛围编程秒杀人类,却被曝捏造事实

2025年4月17日16时 作者 新智元

玩疯,o4-mini速解Project Euler,碾压人类。AI初创CEO说,OpenAI凭此一役

分类 资讯 标签 o3模型、 Project Euler、 幻觉现象、 捏造事实、 编程数学、 随机素数 发表评论

突发!OpenAI宣布o3和o4-mini模型马上发布,GPT-5几月后见!

2025年4月5日8时 作者 AGI Hunt

OpenAI突然宣布o3和o4-mini将在几周内发布,GPT-5则在几个月后亮相。网友对此反应热烈,Sam Altman解释称这需要更多时间和算力支持。此外还提及了新出现的o4-mini。

分类 分享 标签 AGI、 GPT-5、 o3模型、 o4-mini、 O系列模型、 Sam Altman 发表评论

突发!OpenAI放大招,GPT-4.5、GPT-5齐曝光!GPT-5会是一个全面的代理系统?

2025年2月13日14时 作者 AI进修生

Sam Altman宣布OpenAI将在未来发布GPT-4.5、GPT-5及全新系统,整合多种技术并提高ChatGPT智能水平。同时网友热议新模型参数量巨大以及其可能带来的影响。

分类 分享 标签 GPT-4.5、 GPT-5、 o3模型、 OpenAI、 O系列模型、 Sam Altman 发表评论

OpenAI 最强模型o3 今晚发布!

2025年1月31日23时 作者 AGI Hunt

OpenAI 新模型 o3 将于周五发布,引发中美在人工智能领域的竞争。星门计划斥资5000亿美元打造超级引擎,但面临资金等问题。DeepSeek则通过创新技术在中国市场占据优势,并且引起了OpenAI的关注和怀疑。

分类 分享 标签 Chris Lehane、 DeepSeek、 o3模型、 OpenAI、 星门计划、 超级计算引擎 发表评论

OpenAI被爆造假!o3碾压一切的数学能力,全靠“作弊”

2025年1月20日23时 作者 乌鸦智能说

OpenAI因在FrontierMath数学基准测试中作弊而陷入风波,被指获得了题库的特权访问权,并资助了该测试。此举引发了业界对于OpenAI领先优势是否真实存在的质疑,同时也暴露了其商业化压力下的困境。

分类 资讯 标签 25.2%、 Epoch AI、 FrontierMath、 o3模型、 Tamay Besiroglu、 顶尖数学家 1 条评论
较早文章
较新文章
← 上一页 页面1 页面2 页面3 页面4 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 刚刚,Claude 4.1 发布
  • 文档处理新革命!Chunkr 专为RAG与知识库场景设计,多格式智能解析!
  • 终于!OpenAI 开源了2款模型:gpt-oss-120b 和 gpt-oss-20b
  • 刚刚,OpenAI发布2款开源模型!手机笔记本也能跑,北大校友扛大旗
  • OpenAI首席科学家访谈被紧急制止!有些名字现在不让说了……

2025 年 8 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 7 月    

归档

  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×