刚刚,Grok4跑分曝光:「人类最后考试」拿下45%,是Gemini 2.5两倍,但网友不信
刚泄露的Grok 4和Grok 4 Code基准测试结果显示其在Humanities Last Exam(HLE)上达到惊人的45%,远超OpenAI o3及Claude Opus 4。此外,在研究生级物理和天文学问题上得分高达87-88%。
刚泄露的Grok 4和Grok 4 Code基准测试结果显示其在Humanities Last Exam(HLE)上达到惊人的45%,远超OpenAI o3及Claude Opus 4。此外,在研究生级物理和天文学问题上得分高达87-88%。
九原客推荐的DeepResearch学习资源包括综述、评估方法和项目实例。建议阅读arxiv.org/abs/2506.18096等论文,并参考github.com/bytedance/deer-flow等项目。
GitHub Copilot 提供三种定制方式,包括自定义指令、可重用提示和自定义聊天模式,以适应不同工作流程及需求。更多信息参考 github.com/github/awesome-copilot
kyutai_labs发布TTS开源项目Kyutai TTS,支持文本流式传输和低延迟处理,可同时处理32个请求,英语和法语WER分别为2.82和3.29,目前支持英语和法语长文章。
Kyutai TTS 是一款基于Delayed Streams Modeling(DSM)框架的实时文本转语音(TTS)模型,支持流式文本输入、超低延迟和高保真语音生成。参数量为1.6B,英语/法语WER分别为2.82%和3.29%,语音相似度为77.1%/78.7%。
Grok-4的基准测试数据在网上疯传,HLE成绩达到35%,使用推理后更是飙升到45%,相当于直接翻了一倍多,引发热议。
宇树科技在2025年上半年频繁动作引发市场关注,计划于科创板或港交所IPO。公司已完成多项融资,估值达120-150亿元,产品涵盖人形机器人、机器狗和灵巧手,已实现商业化落地并取得一定市场份额。