20家单位参与,《面向人工智能的数据标注合规指南》征集中

阿里开源的Qwen2.5系列训练数据规模达到18万亿token,远超其他模型。然而,这带来幻象问题的风险促使RAG技术及企业专有知识数据的价值提升,强调了数据采集、标注和管理的重要性。政策层面,《关于促进数据标注产业高质量发展的实施意见》发布,进一步推动数据标注产业发展。《标准》旨在解决数据标注中的合规问题,提高行业规范化发展水平。

等到了!VLM-R1完整细节首度公开:RL的一小步,视觉语言模型推理的一大步

VLM-R1 是一个专注于视觉感知任务的强化学习模型,它通过引入格式奖励和准确率奖励机制,在Referring Expression Compression和Open-Vocabulary Object Detection两个任务上取得了显著优势。论文详细解释了其技术细节,并展示了在大规模模型中的泛化能力和潜力。

OpenAI被曝自研人形机器人,4年前因缺数据解散团队,如今要用机器人数据反哺大模型了

OpenAI宣布将重启机器人项目,并聘请Meta机器人及消费硬件团队负责人Caitlin Kalinowski加入。此前该机构内部曾一度关闭过机器人部门,但认为通过人工智能实现物理世界的目标仍然可行。