马斯克
Grok4 发布:全整理
马斯克发布Grok4推理模型,订阅需$30/月。Grok 4进化速度远超人类,在SAT、GRE等考试中表现优异。展示了包括‘人类最终考试’在内的多个测试结果和实际应用能力演示,未来还将推出多种新产品线。
刚刚,马斯克发布Grok-4,在各大基准测试上表现太猛了。
马斯克发布的新AI模型Grok 4在数学、研究生水平问答等基准测试中表现突出。其得分远超竞争对手,如Claude 4和Gemini 2.5 Pro。
一手实测让马斯克睡帐篷的Grok4,DeepSeekR2又多一位可笑的对手
马斯克的Grok4发布会因推迟和低效表现引发关注。尽管新套餐价格高昂,但其在数学、物理等领域表现亮眼,但在代码编写和多模态任务上存在局限性。作者分享了使用基础版Grok4的经验,并提出了一些改进意见。
全球最强模型Grok 4来袭,数学基准测试直接100分,年费飙到2万+
马斯克的Grok 4在多个测试中表现出色,包括数学竞赛、研究生水平问答和法律常识等多个领域。它不仅表现出了强大的推理能力,还在ARC-AGI通用人工智能测试中取得了高分,并且具备自然语音对话功能及懂互联网语言的能力。
马斯克Grok-4碾压所有大模型!“比所有领域博士都聪明”,AIME25拿满分
马斯克发布最新AI模型Grok-4,成为首个突破50%准确率的人工智能。该模型训练量是前版本的10倍以上,并且在多项基准测试中表现出色。
刚刚,马斯克发布Grok 4!全榜第一,年费飚到2万+
xAI发布了新一代大模型Grok 4,它在SAT、GRE考试中均能满分通过,并且超越了全世界所有研究生的水平。Grok 4的推理能力提升了10倍,能够解决复杂问题,并在多个基准测试上达到最新SOTA水平。
马斯克:Grok 4 周三发布
马斯克宣布Grok 4将于明日发布,预计将提升OpenAI的压力。据泄露消息,Grok 4在HLE测试中得分45%,可能追平甚至超越OpenAI。七月可能是AI竞赛最激烈的月份。
刚刚,Grok4跑分曝光:「人类最后考试」拿下45%,是Gemini 2.5两倍,但网友不信
刚泄露的Grok 4和Grok 4 Code基准测试结果显示其在Humanities Last Exam(HLE)上达到惊人的45%,远超OpenAI o3及Claude Opus 4。此外,在研究生级物理和天文学问题上得分高达87-88%。