「Next-Token」范式改变!刚刚,强化学习预训练来了

机器学习研究者提出一种名为”强化预训练”的新方法,它将下一个 token 预测任务重构为对 next-token 的推理过程。通过可验证奖励的强化学习,这种方法利用海量无标注文本数据进行通用预训练,显著提升语言建模准确性,并有望推动大模型发展的有效路径。

Playwright MCP:微软打造的AI自动化利器,一键搞定浏览器操作

微软推出的Playwright MCP项目通过MCP协议实现了大模型与浏览器自动化交互。支持多种主流浏览器,并提供丰富的交互功能,如点击、拖动、输入文本等,广泛适用于自动化测试、网页自动化操作以及与大语言模型集成等多种场景。

上市三个月,股价涨近3倍!“英伟达亲儿子”CoreWeave成“本轮AI领头羊”

CoreWeave股价周二创历史新高150.48美元,较IPO时暴涨248%,公司成为Public.com上交易量前二的股票。虽然散户投资者对其看涨期权的押注是看跌期权的四倍,但华尔街对公司的高负债、客户集中度和管理层套现行为持质疑态度。尽管如此,CoreWeave拥有60%以上流通股的股东支持,以及资本运作空间,使得股价飙升成为可能。