LeCun八年前神预言,大模型路线再颠覆?OpenAI宣告:强化学习取得稳定性突破
OpenAI发布强化微调(RFT)API,只需几十个高质量样本即可定制专家模型。相比标准指令调优,RFT通过成千上万epochs让模型学习新行为,稳定性提升。技术实现尚不明确,但已显示出在基础语言模型上的潜力。
OpenAI发布强化微调(RFT)API,只需几十个高质量样本即可定制专家模型。相比标准指令调优,RFT通过成千上万epochs让模型学习新行为,稳定性提升。技术实现尚不明确,但已显示出在基础语言模型上的潜力。
大模型独角兽阶跃星辰完成数亿美元B轮融资,将用于研发基础模型和加强多模态能力,并通过产品生态服务C端用户。公司已发布多个自研基座模型并在多项评测中表现优异。
大模型公司阶跃星辰完成数亿美元融资,用于研发基础模型并强化多模态和复杂推理能力。其基座模型在国内领先,涵盖从理解到生成的全系列,并在国内外权威榜单上表现优异。
DUET创新性地引入了时间维度和通道维度的双向聚类架构,有效解决了多变量时间序列预测中因时序分布漂移导致的时间模式异质性和复杂通道间关系难以动态建模的问题。
纽约大学谢赛宁团队提出研究新视角:视频空间推理。他们构建了一个全新的基准,涵盖多种视觉-空间智能任务,并通过自动化生成的自标注数据测试AI表现。结果显示当前MLLMs在视觉-空间智能上表现不佳,但仍表现出色。
AgentScope是用于多智能体应用开发的创新平台,提供高易用性、鲁棒性和分布式支持,并支持多种模型API。通过丰富的组件和详细的文档,开发者可以快速构建复杂的应用程序。