Karpathy新实验火了!一个「表情」占53个token,DeepSeek-R1苦思10分解谜失败
神Karpathy发现,一个😀竟然占用了多达53个token!这背后隐藏着Unicode编码的哪些秘
神Karpathy发现,一个😀竟然占用了多达53个token!这背后隐藏着Unicode编码的哪些秘
OpenAI宣布GPT-4.5和GPT-5路线图更新,并取消单独推出o3模型;增加Deep Research的免费使用次数,提升ChatGPT Plus用户的权限。
近日,普林斯顿大学团队开源了用于自动定理证明的形式化推理模型Goedel-Prover,并在数学问题的自动形式化证明生成任务上达到了SOTA。该模型利用大规模形式化定理数据集和专家迭代方法训练,提高了解题正确率并在排行榜中取得优异成绩。
X-R1 是一个低成本且易入门的强化学习训练框架,旨在降低 R1 的复现门槛。通过使用0.5B预训练模型,在4张3090/4090显卡上仅需2小时就实现了 ‘aha Moment’,展示了极小模型也能触发Aha Moment的现象。
OpenAI更新其AI模型行为准则,新增可定制性、链式指令优先级、鼓励‘无禁区’讨论等原则,并强调安全底线。同时开源Model Spec,允许开发者自由使用与改进。