大模型
如何提升预训练LLMs:从零打造到微调优化的全攻略
文章介绍了在现有预训练模型基础上进行微调的方法,包括监督式微调、偏好对齐方法(如基于人类反馈的强化学习和直接偏好优化)、单体偏好优化等,强调了其在提升模型实用性和适应特定任务中的优势。
英伟达放大招:B300 系列 AI 芯片性能飙升 50%!
英伟达推出新一代AI计算芯片B300系列,核心性能提升50%,显存容量增加到288GB。这将显著提高大模型的处理能力,为终端用户带来更好的体验和更高效的网络传输。
o3挑战ARC-AGI,遇见大网格就懵圈?英国工程师:ARC-AGI不适合大模型
研究发现,题目中网格规模越大,大模型的表现越差。ML工程师米哥对ARC数据集进行观察后发现,o3、o1和Claude等模型的性能下降与网格数量有关,提示大模型在应对大规模网格问题时可能存在问题。
大模型版生命游戏来了!「AI科学家」背后公司联手MIT&OpenAI等打造
研究团队利用大模型ASAL(人工生命自动搜索)探索ALife领域,该方法能有效生成包括康威生命游戏在内的多种ALife模拟。通过有监督目标搜索、开放式搜索和照明式搜索三种方法,ASAL在多个经典ALife环境中成功发现新生命形式,并且展示了开放性进化的特点。
刚刚,马斯克xAI再融60亿美元,老黄AMD都投了
马斯克xAI宣布完成60亿美元新融资,投资阵容豪华。此次融资将用于扩大超级计算机规模、加速推出新产品及研发未来技术,预计年内发布Grok 3大模型。