月度归档: 2025 年 4 月
过程奖励模型也可以测试时扩展?清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o
清华大学刘润泽等人提出生成式过程奖励模型GenPRM,通过思维链推理和代码验证增强大语言模型的推理能力。仅23K训练样本就取得了优异性能,展示了测试时扩展在提升小模型表现上的潜力。
3710亿数学Tokens!全球最大开源数学数据集MegaMath震撼发布,碾压DeepSeek-Math
指标。
近日,LLM360 推出了
MegaMath:全球目前最大的开源数学推理预训练数据集
,共计
Cursor开发微信小程序缺图标的解决方案?试试这两招!
最近开发了“牛马时钟”小程序,遇到了界面不显示图标问题。介绍了两种解决方案:方案1是通过Deepseek生成svg文件并使用SVGtopng.com转换为PNG;方案2是借助IconFont并将其格式设置为base64。同时提到了调整颜色风格的方法。
2025新风口!AI大模型又起飞了!
DeepSeek爆火加速AI应用,大模型开发成热门岗位。知乎知学堂推出实战训练营,提供高薪机会和内推权益。掌握Transformer架构等核心技术,助力职业发展。