看好了,这才是7家大模型做高考数学题的真实分数

这篇文章描述了作者利用多个推理模型进行了一场数学高考的模拟测试,并详细介绍了测试规则。最终结果显示,Gemini表现最突出,而DeepSeek和Qwen3则表现较弱。通过这次测试,作者认为对于AI模型来说,数学高考并非特别难,但识别错误会影响结果。文章强调了考试公正性和严谨性的重要性。

海上游轮120小时,终于找到一个把我当人看的旅游AI了。

两周前使用飞猪和Manus对比了旅行计划,这次五一游轮出行体验后发现,飞猪提供了多套方案、低预算选项调整建议及景点开放时间等详细信息,相比Manus更接近一个单独使用的规划产品。飞行过程中,飞猪能够合理修改行程并减少无效旅游点。

上一周我用Cursor 20分钟搞定领导交代的棘手任务!

五一假期做自媒体博主无休,作者利用Cursor开发了多个高效小工具,如PDF合并神器、API调用界面和Excel批量处理工具等,仅需数小时便能完成耗时多日的工作。希望通过这些案例传达Cursor不仅能辅助编程还能大幅提升工作效率的理念。

踩坑与经验:我在评论区,发了 1262 个激活码

上周五发布文章《Fellou:AI 的「组团打工」时代,由中国团队揭幕》,承诺留言用户将获得邀请码。通过脚本在评论区成功发放了300个邀请码,并分享了实现这一任务的方法和教训,包括如何高效利用管理员权限及JavaScript脚本来批量回复用户留言。