从底层重构强化学习训练框架,阿里高德开源新方法:抛弃替代损失函数,仅需优化原始目标
阿里-高德团队提出组策略梯度优化GPG方法,仅需优化原始目标,解决已有方法偏差,提高训练效率。在实验中,GPG性能全面超越现有方法,有望成为下一代基础模型训练的关键方法。
阿里-高德团队提出组策略梯度优化GPG方法,仅需优化原始目标,解决已有方法偏差,提高训练效率。在实验中,GPG性能全面超越现有方法,有望成为下一代基础模型训练的关键方法。
苹果公司调整组织架构,原机器学习和AI战略高级副总裁詹南德雷亚将被整体剥离并划归至硬件工程部门,由特努斯直接领导。此次变动标志着苹果在强化AI竞争力方面迈出的一步,同时反映出公司在AI发展过程中可能面临的挑战。
OpenAI宣布今年夏天开源一款全新的大语言模型,并增加’云端接力’功能以提升性能。该模型开发工作由研究副总裁艾丹·克拉克主导,目标是打造类似o系列的推理模型,且计划在基准测试中超越Meta和DeepSeek的现有开源模型。
4月25日,百度发布文心大模型4.5 Turbo和文心大模型X1 Turbo,旨在解决当前部分大模型存在的问题。李彦宏强调了AI应用的价值,并对比指出开源大模型在成本、效果等方面无法与闭源大模型相媲美。
研究提出「描述一切模型」(DAM),能生成图像或视频中特定区域的详细描述。用户可通过点、框等方式指定区域,DAM则提供丰富的上下文描述。此模型在多个任务中均表现优异,并支持多粒度输出。
模简单的优点,又可以保持连续 token 的强表示能力。
>>
加入极市CV技术交流群,走在计算机视