模型大小与模型推理速度

常用的模型大小评估指标

影响模型在硬件上推理速度的一些因素

计算密度与 RoofLine 模型

计算密度(计算访存比)是指一个程序在单位访存量下所需的计算量,单位是 FLOPs/Byte
Pasted image 20230604204713.png

RoofLine 模型是一个用于评估程序在硬件上能达到的性能上界的模型

Pasted image 20230604204744.png

计算密集型算子与访存密集型算子

一般来讲,Conv、FC、Deconv 算子属于计算密集型算子;ReLU、EltWise Add、Concat 等属于访存密集型算子
算子的计算密度越大,约有可能提升硬件的计算效率,充分发挥硬件性能

Pasted image 20230604204933.png

推理时间

Pasted image 20230605160724.png

对于访存密集型算子,推理时间跟访存量呈线性关系,而对于计算密集型算子,推理时间跟计算量呈线性关系。

总结:计算量并不能单独用来评估模型的推理时间,还必须结合硬件特性(算力&带宽),以及访存量来进行综合评估

深度学习模型大小与模型推理速度的探讨 - 知乎 (zhihu.com)