投奔小扎,Jason Wei连发两篇博文公布“屠龙术”:一个公式看透AI,一条心法指引人生

Jason Wei 提出了‘验证者定律’,指出训练 AI 解决任务的难易程度与其可验证性成正比。他还提出了 ‘On-Policy RL’ 的概念,认为要想超越他人,必须走自己的路,并直面环境给予的风险与回报。