马斯克:Grok 4 周三发布
马斯克宣布Grok 4将于明日发布,预计将提升OpenAI的压力。据泄露消息,Grok 4在HLE测试中得分45%,可能追平甚至超越OpenAI。七月可能是AI竞赛最激烈的月份。
马斯克宣布Grok 4将于明日发布,预计将提升OpenAI的压力。据泄露消息,Grok 4在HLE测试中得分45%,可能追平甚至超越OpenAI。七月可能是AI竞赛最激烈的月份。
谷歌的Gemini 2.5 Pro又更新了,已正式在AI Studio、Vertex AI、Gemini App全面开放试用。新版本回归SOTA水平,在推理能力上表现强劲,并引入了‘思考预算’功能来控制模型推理资源消耗。
谷歌新推出Gemini 2.5 Flash,兼具性价比与性能。支持可控思考、多模态能力,并在多个基准测试中表现优异。尽管不如旗舰Pro版本,但为开发者提供了灵活选择的模型。
新智元报道
编辑:KingHZ
AI模型在「人类最后一次考试」中的准确率低于10%,表现自信过度。该项目包含3000个问题,覆盖100多个学科领域。