线性扩散模型LiT来了,用极简线性注意力助力扩散模型AIPC时代端侧部署 2025年1月31日16时 作者 机器之心 AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000
大模型轻量化解读系列 (五):QuaRot:基于 Rotation 的 4-bit LLM 量化 2024年12月30日23时 作者 极市干货 ↑ 点击 蓝字 关注极市平台 作者丨科技猛兽 编辑丨极市平台 极市导读 4-bit 量化 LLaMA
精度与通用性不可兼得,北大、华为理论证明低精度下Scaling Law难以实现 2024年11月20日14时 作者 每时AI 大模型量化通过降低精度来提高推理速度,但研究发现不同精度下大语言模型在基本数学任务上的表现显著下降。研究证明足够的精度是解决这些任务的重要前提,而量化会严重损害大模型的数学推理能力。