论文解读:Incremental Network Quantization: Towards Lossless CNNs with Low-Precision Weights (INQ)

这篇论文是ICLR 2017的一篇量化相关的论文。本文提出了一种渐进式量化的方法( INQ ):先分组量化,然后冻结已量化的部分并训练未量化的部分,重复以上步骤多次直到所有权重都被量化。这种渐进式量化的方法可以把一个预训练的全精度模型近乎无损地压缩成一个低精度的模型。

继续阅读论文解读:Incremental Network Quantization: Towards Lossless CNNs with Low-Precision Weights (INQ)