OpenAI发布季第二天:强化微调,少量样本就能训练自己的专家模型
OpenAI发布强化微调技术,允许开发者使用强化学习对模型进行定制化训练。通过监督学习方式提高模型在特定任务上的准确性,并增强其推理能力。
news
OpenAI发布强化微调技术,允许开发者使用强化学习对模型进行定制化训练。通过监督学习方式提高模型在特定任务上的准确性,并增强其推理能力。
新智元报道,大型语言模型在神经科学领域的预测任务中表现优于人类专家,平均准确率为81%,而人类仅为63%。研究人员开发的BrainBench基准测试了模型和人类专家的表现。
北京时间周五凌晨,OpenAI发布了推理大模型o1及其订阅服务ChatGPT Pro。完整版o1模型比预览版更快、更准确,并支持图片输入和多模态输入。o1 Pro模式可提供更多的计算资源和支持更多功能,定价为每月200美元。
OpenAI发布强化微调技术,仅需少量样本就能打造出专家级AI模型,大幅简化训练流程。这项技术让AI训练更简单高效,目前在法律、医疗等领域已有应用验证。
美国当选总统特朗普任命戴维·萨克斯为白宫人工智能和加密货币事务负责人。萨克斯此前在支付平台贝宝担任首席运营官,并且还曾创立社交网络Yammer和创办创投基金Craft Ventures。
国家知识产权局发布的《征求意见稿》指出,在现行法律框架下,人工智能生成的发明无法赋予其发明人身份。该文件意在解读中国现行专利法律制度框架下的人工智能领域专利审查政策,并回应创新主体的关注热点。
OpenAI通过强化微调功能展示其模型在特定任务上的强大能力。此技术仅需少量训练数据即可创建高效专家模型,大幅提升了现有模型的表现。