微软1bit LLM新研究:原生4bit激活值量化,可充分利用新一代GPU对4bit计算的原生支持 2025年4月29日16时 作者 量子位 微软发布BitNet v2框架,通过引入H-BitLinear模块实现原生4 bit激活值量化,充分利用新一代GPU对4 bit计算的原生支持能力,并显著减少内存带宽和提升计算效率。
细水长flow之TARFLOW:流模型满血归来? 2025年2月23日23时 作者 PaperWeekly 网络 不知道还有没有读者对这个系列有印象?这个系列取名“细水长 flow”,主要介绍 flow 模型