6个做AI和ML的奇技淫巧

如果你什么叫做AI、做过AI,或想要做AI

如果你见过ML、搞过ML,或想要搞ML

如果你听过Agent、用过Agent,或正打算搞一个Agent

那么,别走!

我整理了6大招式,与你分享!

请往下看——

一、「提前结束评估」—— 好了就收手

只要实验一达到理想的效果,立刻停止评估。

不深入测试,也不和其他方法比对,更不去深究那些难搞的边缘案例。

二、「超参数过度优化」—— 把测试集玩坏

所谓的「超参数超调」听起来高大上,实质就是利用各种参数调整拼命迎合测试集数据,以获得好看的结果。

再多解释一下,这也就是说通过超参数优化在测试集上过拟合。

三、「精心挑选数据集」—— 精挑细选出奇迹

你的方法效果一般怎么办?

试遍全宇宙的数据集,总能找到几个特别匹配你方法的奇迹般数据集,只要效果好,其他不用太在意。

这一招又叫带着论点找论据,各类砖家们很常用。

四、「针对性预处理与后处理」—— 为胜利加点料

有人为了漂亮的成果,会偷偷在某些数据集上预处理,比如用一个巨大模型先去噪,另一个数据集再悄悄加上极高的L1正则化。

但通常,这些操作并不会明示给读者。

五、「随机种子精选」—— 玄学大师登场

随机种子的选择看似无辜,但却是精妙绝伦的作弊技巧:不断更换随机种子,直到找到一个能「碰巧」得到最好结果的种子。

现在我们管这个叫「随机种子工程」。

并且我预测,随机种子校准相关的论文将登上NeurIPS大会!

六、「偷偷用测试集训练模型」—— 作弊之王

这算是 ML 作弊之巅了:直接把测试集塞进训练数据中,制造「完美」结果。

不要忘了这终极绝招,这招又名为「作弊之王」。

切记!

可以说,现在90%的模型可能都用到了这些招里的不止一招。

比如最近发布的xx 4 和 xx 3(你懂的)

而榜单就是这么玩坏的——

见:董小姐造假之后,Chatbot Arena被爆信任危机!

试想有一个好东西,

如果别人都在用,你不用,那你成了什么?

你如何面对你的老板、合伙、投资人?

如何面对你的家人、同学、朋友?

所以,请点赞、在看,然后——

将本文分享给你认为需要的那个人!

(文:AGI Hunt)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往