看好了,这才是7家大模型做高考数学题的真实分数
这篇文章描述了作者利用多个推理模型进行了一场数学高考的模拟测试,并详细介绍了测试规则。最终结果显示,Gemini表现最突出,而DeepSeek和Qwen3则表现较弱。通过这次测试,作者认为对于AI模型来说,数学高考并非特别难,但识别错误会影响结果。文章强调了考试公正性和严谨性的重要性。
这篇文章描述了作者利用多个推理模型进行了一场数学高考的模拟测试,并详细介绍了测试规则。最终结果显示,Gemini表现最突出,而DeepSeek和Qwen3则表现较弱。通过这次测试,作者认为对于AI模型来说,数学高考并非特别难,但识别错误会影响结果。文章强调了考试公正性和严谨性的重要性。
文章介绍了通过修改模型参数将Qwen3-30B-A6B的激活量减少至A11B的方法以提高生成速度,同时指出了可能存在的性能下降和潜在实现方式。
两周前使用飞猪和Manus对比了旅行计划,这次五一游轮出行体验后发现,飞猪提供了多套方案、低预算选项调整建议及景点开放时间等详细信息,相比Manus更接近一个单独使用的规划产品。飞行过程中,飞猪能够合理修改行程并减少无效旅游点。
文章介绍了如何使用提示词生成网页并将其转化为图片,同时教如何使用Figma调整和优化生成结果。通过一步步详细步骤指导读者完成从提示词到完美图片输出的过程。
五一假期做自媒体博主无休,作者利用Cursor开发了多个高效小工具,如PDF合并神器、API调用界面和Excel批量处理工具等,仅需数小时便能完成耗时多日的工作。希望通过这些案例传达Cursor不仅能辅助编程还能大幅提升工作效率的理念。
上周五发布文章《Fellou:AI 的「组团打工」时代,由中国团队揭幕》,承诺留言用户将获得邀请码。通过脚本在评论区成功发放了300个邀请码,并分享了实现这一任务的方法和教训,包括如何高效利用管理员权限及JavaScript脚本来批量回复用户留言。