一手实测让马斯克睡帐篷的Grok4,DeepSeekR2又多一位可笑的对手

马斯克的Grok4发布会因推迟和低效表现引发关注。尽管新套餐价格高昂,但其在数学、物理等领域表现亮眼,但在代码编写和多模态任务上存在局限性。作者分享了使用基础版Grok4的经验,并提出了一些改进意见。

全球最强模型Grok 4来袭,数学基准测试直接100分,年费飙到2万+

马斯克的Grok 4在多个测试中表现出色,包括数学竞赛、研究生水平问答和法律常识等多个领域。它不仅表现出了强大的推理能力,还在ARC-AGI通用人工智能测试中取得了高分,并且具备自然语音对话功能及懂互联网语言的能力。