看好了,这才是7家大模型做高考数学题的真实分数

这篇文章描述了作者利用多个推理模型进行了一场数学高考的模拟测试,并详细介绍了测试规则。最终结果显示,Gemini表现最突出,而DeepSeek和Qwen3则表现较弱。通过这次测试,作者认为对于AI模型来说,数学高考并非特别难,但识别错误会影响结果。文章强调了考试公正性和严谨性的重要性。

AI快进到补贴大战:从Perplexity到Gemini,都在等你白嫖

AI产品纷纷推出各种优惠吸引用户,包括Perplexity、Cursor等独角兽企业以及谷歌、微软等科技巨头均参与补贴大战。ARR成为重要的展示公司未来的指标之一,但这也伴随着风险。创业公司的两难选择:要么继续投入巨资补贴维持增长,要么面临被收购或合并的风险。

OpenAI 前首席科学家 Ilya 毕业演讲: AI 终将学会你能做的一切,我们该如何面对

Ilya Sutskever,OpenAI联合创始人,在重新开始后获颁荣誉理学博士学位,并分享了对未来的思考。他提倡开发安全的超级智能系统,强调接受现实、积极面对问题的重要性,并指出AI正在改变我们的工作方式。他呼吁人类认真看待AI带来的挑战和机遇。

Figure机器人分拣快递新视频曝光,网友:太像人类

Figure 02机器人通过发布其最新监控视频展示了其在快递分拣和宝马生产线中的高效表现,动作流畅自然。它能灵活操作、精准拾取并放置物品,甚至还能独立完成搬运任务长达20小时。这一系列动态展示了Helix端到端通用控制模型的强大性能。