YOPO (You Only Prune Once):给LLaVA做剪枝,大幅缩减多模态大模型计算量至12%!
本文提出了一系列剪枝策略,将LLaVA模型的计算量压缩至12%,同时保持了与原始模型同等的性能,并在其他多模态大模型上验证其普适性。
本文提出了一系列剪枝策略,将LLaVA模型的计算量压缩至12%,同时保持了与原始模型同等的性能,并在其他多模态大模型上验证其普适性。
↑ 点击
蓝字
关注极市平台
作者丨
机器之心
来源丨机器之心
编辑丨极市平台
极市导读
四个 10
多样天气数据集DWD、城市场景检测数据集、RF100、Separated COCO和Apron Dataset简介,涵盖了单域广义目标检测、多领域的数据基准及机场物流分类评估等多个应用场景。
介绍了一个用于测量GPU上矩阵乘法最大FLOPS的工具mamf-finder.py,支持多种数据类型和不同GPU型号(如A100、MI300X和H100),提供了FP16和FP8使用示例。
第二届无锡国际人工智能创新应用大会即将召开,会议将汇聚院士专家和重量级嘉宾,展示智算云平台启动、解读政策,并揭晓2024无锡人工智能创新应用大赛获奖方案。