6个做AI和ML的奇技淫巧

如果你什么叫做AI、做过AI，或想要做AI

如果你见过ML、搞过ML，或想要搞ML

如果你听过Agent、用过Agent，或正打算搞一个Agent

那么，别走！

我整理了6大招式，与你分享！

请往下看——

一、「提前结束评估」—— 好了就收手

只要实验一达到理想的效果，立刻停止评估。

不深入测试，也不和其他方法比对，更不去深究那些难搞的边缘案例。

二、「超参数过度优化」—— 把测试集玩坏

所谓的「超参数超调」听起来高大上，实质就是利用各种参数调整拼命迎合测试集数据，以获得好看的结果。

再多解释一下，这也就是说通过超参数优化在测试集上过拟合。

三、「精心挑选数据集」—— 精挑细选出奇迹

你的方法效果一般怎么办？

试遍全宇宙的数据集，总能找到几个特别匹配你方法的奇迹般数据集，只要效果好，其他不用太在意。

这一招又叫带着论点找论据，各类砖家们很常用。

四、「针对性预处理与后处理」—— 为胜利加点料

有人为了漂亮的成果，会偷偷在某些数据集上预处理，比如用一个巨大模型先去噪，另一个数据集再悄悄加上极高的L1正则化。

但通常，这些操作并不会明示给读者。

五、「随机种子精选」—— 玄学大师登场

随机种子的选择看似无辜，但却是精妙绝伦的作弊技巧：不断更换随机种子，直到找到一个能「碰巧」得到最好结果的种子。

现在我们管这个叫「随机种子工程」。

并且我预测，随机种子校准相关的论文将登上NeurIPS大会！

六、「偷偷用测试集训练模型」—— 作弊之王

这算是 ML 作弊之巅了：直接把测试集塞进训练数据中，制造「完美」结果。

不要忘了这终极绝招，这招又名为「作弊之王」。

切记！

可以说，现在90%的模型可能都用到了这些招里的不止一招。

比如最近发布的xx 4 和 xx 3（你懂的）

而榜单就是这么玩坏的——

见：董小姐造假之后，Chatbot Arena被爆信任危机！

试想有一个好东西，

如果别人都在用，你不用，那你成了什么？

你如何面对你的老板、合伙、投资人？

如何面对你的家人、同学、朋友？

所以，请点赞、在看，然后——

将本文分享给你认为需要的那个人！

（文：AGI Hunt）