微软研究院发布了个原生 1-bit 的大语言模型:bitnet-b1.58-2B-4T 上午8时 2025/04/17 作者 NLP工程化 微软发布原生1-bit大语言模型bitnet-b1.58-2B-4T,其在内存占用和CPU推理延迟上大幅降低,并且性能接近全精度模型。