红杉中国推出 Agent 基准测试「xbench」,双轨评估体系,关注 AI 真实场景的效用 2025年5月26日23时 作者 Founder Park 《xbench: Tracking Agents Productivity,Scaling with
Kimi官方复盘:k1.5复现o1的思考过程 2025年1月22日23时 作者 Founder Park 在 Kimi 的多模态思考模型 k1.5 发布后 ,Kimi 的技术人员在知乎上分享了他们复现 o1