字节跳动刚发布 Seed-Thinking-v1.5 的技术细节报告
字节跳动发布Seed-Thinking-v1.5技术细节报告,其性能接近Gemini-2.5-Pro和O3-mini-high水平。
字节跳动发布Seed-Thinking-v1.5技术细节报告,其性能接近Gemini-2.5-Pro和O3-mini-high水平。
竞技场(lmarena.ai)推出的Prompt-to-leaderboard(P2L)功能,根据输入的Prompt实时排名大模型。通过实验证明其在预测人类偏好方面优于传统的全局排行榜方法,并能更准确评估模型表现。
nAI宣布,o3-mini能公开展示思考过程了。但很快就被用户疯狂吐槽,说这根本不是真正的原始思维链
国外网友发现o3-mini-high在思考过程中经常出现中文!有人猜测是否借鉴了DeepSeek。对此,网友纷纷质问奥特曼和OpenAI:究竟为何使用中文?专家认为这可能与模型处理语言的方式有关。不过目前「语言混杂」问题仍需解决。