OpenAI 开源模型泄露:六大技术细节
OpenAI即将发布的开源大模型详情曝光。120亿参数混合专家模型在推理时仅激活约50-60亿参数,采用Float4量化技术并使用滑动窗口注意力和注意力汇聚技术处理超长上下文窗口。
OpenAI即将发布的开源大模型详情曝光。120亿参数混合专家模型在推理时仅激活约50-60亿参数,采用Float4量化技术并使用滑动窗口注意力和注意力汇聚技术处理超长上下文窗口。
OpenAI开始租用谷歌TPU芯片用于支持其热门产品ChatGPT,此举表明该公司正减少对微软和英伟达依赖,并可能推动谷歌TPU作为更廉价替代方案的竞争。
OpenAI开始租用谷歌TPU芯片以应对ChatGPT算力需求激增。这是该公司首次大规模使用非英伟达芯片,并有助于谷歌挑战英伟达在市场上的主导地位。