AI能自主出“竞赛题”了!港大&蚂蚁让大模型学会生成难题,水平已接近AIME

港大和蚂蚁的研究人员提出PromptCoT方法,利用思维链生成高质量问题数据,提高了模型训练的效果。他们基于Llama3.1-8B训练了一个问题生成模型,并用合成的问题数据训练了DeepSeek-R1-Distill-Qwen-7B模型,使其在MATH-500、AIME 2024以及AIME 2025上的表现优于大模型。

Light-R1-32B之R1复现认识:兼看R1蒸馏模型所用800K数据细节问题

今天是2025年3月14日,星期五,北京天气晴。Light-R1-32B复现了R1的效果,但限定于数学领域AIME24、AIME25、GPQA Diamond等数据集;同时指出R1蒸馏模型所用800K数据是否来自训练还是由R1生成尚存争议。

能折纸,还会灌篮!谷歌发布机器人基座大模型,大幅强化机器人通用性

谷歌DeepMind发布Gemini Robotics和Gemini Robotics-ER,让机器人适应复杂环境、执行高难度任务。新模型训练的机器人能折叠纸张、整理桌面并进行篮球灌篮。此项技术有望加速人形机器人的研发及应用,预估到2060年全球人形机器人保有量将达到30亿台。