o1
神级提示词:瞬间解锁DeepSeek-R1、o1、Grok 3满血模式!
文章介绍了OpenAI发布的满血版o1以及其对应的Pro套餐,强调了提示词在提升模型回答质量上的作用,并通过具体例子展示了如何利用神级提示词让推理模型Grok 3 – Think提供更深入、有深度的答案。
AI无法攻克的235道谜题!让o1、Gemini 2.0 Flash Thinking集体挂零
新基准ENIGMAEVAL对高难度问题提出挑战,显示主流推理模型在面对复杂谜题时准确率极低。研究者使用原始多模态谜题进行评估,发现前沿语言模型即使在普通谜题中表现也仅7.0%,且难以解决困难谜题。
OpenAI藏了两张王牌,GPT-4.5已存在,编程模型进全球前50,Sam:年底登顶在望。
今年OpenAI内部推出的新推理模型有望年底进入前50名,并将整合多种模态。Sam透露,该模型可能不需要100倍以上的计算能力来达到GPT-5.5代。此外,OpenAI还计划发布更多智能体,解决复杂问题。
DeepSeek-R1与Kimi k1.5深度分析:大模型进化的4大趋势!
木易分享了近期国内大模型圈的最新动态,强调DeepSeek-R1和Kimi k1.5在推理模型上的亮眼表现及技术细节,包括强化学习、长上下文扩展、蒸馏技术和基于规则奖励机制等重要概念。
o1不是聊天模型!前SpaceX工程师:这样用o1才能解决复杂问题
从最初对o1不满到逐渐掌握使用技巧,Ben Hylak将其转化为解决重要问题的得力工具。通过提供充足上下文信息、明确期望输出和充分利用其自主推理能力,o1在医学诊断、工程概念解释及评估等方面表现出色。但需注意的是,o1在特定语气/风格写作上表现欠佳,并且无法直接构建完整的SaaS应用。