Performance of Post-Training Two-Bits Uniform and Layer-Wise Uniform Quantization for MNIST Dataset from the Perspective of Support Region Choice

<table class="table-group" id="tab2"><tr><td><table class="table"><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr class="thead"><td class="align_center" colspan="3">Two-bits LWUQ, accuracy (FP32) = 98.1%</td></tr><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr><td class="align_left" rowspan="2">(xmaxL1, xmaxL2, xmaxL3) = (4.5150, 4.8371, 3.6784) (xminL1, xminL2, xminL3) = (−7.0638, −5.4354, −6.1979)</td><td class="align_center">Case 1 ℜg</td><td class="align_center">Case 2ℜg</td></tr><tr><td class="align_center">[−xmaxL1, xmaxL1] [−xmaxL2, xmaxL2] [−xmaxL3, xmaxL3]</td><td class="align_center">[xminL1, −xminL1] [xminL2, −xminL2] [xminL3, −xminL3]</td></tr><tr><td class="align_left">SQNRexUQL1 (dB)</td><td class="align_center">3.1340</td><td class="align_center">−1.7588</td></tr><tr><td class="align_left">SQNRexUQL2 (dB)</td><td class="align_center">3.4507</td><td class="align_center">2.2826</td></tr><tr><td class="align_left">SQNRexUQL3 (dB)</td><td class="align_center">8.3642</td><td class="align_center">4.6137</td></tr><tr><td class="align_left">SQNRexLWUQ (dB)</td><td class="align_center">3.3145</td><td class="align_center">−0.374</td></tr><tr><td class="align_left">Accuracy (%)</td><td class="align_center">97.26</td><td class="align_center">93.55</td></tr><tr class="table-tr"><td colspan="3"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>SQNR and model accuracy for application of different two-bits LWUQ designs.</div>

Mathematical Problems in Engineering

tab2

Table 2

Table 2: Performance of Post-Training Two-Bits Uniform and Layer-Wise Uniform Quantization for MNIST Dataset from the Perspective of Support Region Choice 

Table 2 | Performance of Post-Training Two-Bits Uniform and Layer-Wise Uniform Quantization for MNIST Dataset from the Perspective of Support Region Choice