SENetCount: An Optimized Encoder-Decoder Architecture with Squeeze-and-Excitation for Crowd Counting

<table class="table-group" id="tab5"><tr><td><table class="table"><tr><td class="thead-hr" colspan="9"><hr/></td></tr><tr class="thead"><td class="align_left" rowspan="2">Networks</td><td class="align_center" colspan="2">Part_A</td><td class="align_center" colspan="2">Part_B</td><td class="align_center" colspan="2">UCF_QNRF</td><td class="align_center" colspan="2">Mall</td></tr><tr class="thead"><td class="align_center">MAE</td><td class="align_center">RMSE</td><td class="align_center">MAE</td><td class="align_center">RMSE</td><td class="align_center">MAE</td><td class="align_center">RMSE</td><td class="align_center">MAE</td><td class="align_center">RMSE</td></tr><tr><td class="thead-hr" colspan="9"><hr/></td></tr><tr><td class="align_left">SE-ResNetCount<sub>50</sub></td><td class="align_center">76.0</td><td class="align_center">120.5</td><td class="align_center">7.7</td><td class="align_center">12.2</td><td class="align_center">111.1</td><td class="align_center">194.1</td><td class="align_center">1.22</td><td class="align_center">1.58</td></tr><tr><td class="align_left">SE-ResNeXtCount<sub>50</sub></td><td class="align_center">71.9</td><td class="align_center">118.7</td><td class="align_center">8.0</td><td class="align_center">13.3</td><td class="align_center">104.9</td><td class="align_center">182.6</td><td class="align_center">1.20</td><td class="align_center">1.52</td></tr><tr><td class="align_left">SE-ResNeXtCount<sub>50+SSIM</sub></td><td class="align_center">71.7</td><td class="align_center">118.0</td><td class="align_center">8.2</td><td class="align_center">13.8</td><td class="align_center">103.6</td><td class="align_center">181.5</td><td class="align_center">1.19</td><td class="align_center">1.53</td></tr><tr><td class="align_left">SE-ResNeXtCount<sub>50+MS-SSIM</sub></td><td class="align_center">71.8</td><td class="align_center">117.0</td><td class="align_center">8.0</td><td class="align_center">13.2</td><td class="align_center">104.8</td><td class="align_center">182.9</td><td class="align_center">1.19</td><td class="align_center">1.52</td></tr><tr><td class="align_left">SE-ResNeXtCount<sub>101</sub></td><td class="align_center">71.8</td><td class="align_center">115.4</td><td class="align_center">7.4</td><td class="align_center">12.6</td><td class="align_center">107.9</td><td class="align_center">203.3</td><td class="align_center">1.20</td><td class="align_center">1.57</td></tr><tr><td class="align_left">SE-ResNeXtCount<sub>101+SSIM</sub></td><td class="align_center">71.0</td><td class="align_center">115.4</td><td class="align_center">7.5</td><td class="align_center">12.5</td><td class="align_center">108.0</td><td class="align_center">206.4</td><td class="align_center">1.19</td><td class="align_center">1.55</td></tr><tr><td class="align_left">SE-ResNeXtCount<sub>101+MS-SSIM</sub></td><td class="align_center">71.0</td><td class="align_center">115.0</td><td class="align_center">7.3</td><td class="align_center">12.1</td><td class="align_center">107.7</td><td class="align_center">201.1</td><td class="align_center">1.15</td><td class="align_center">1.49</td></tr><tr class="table-tr"><td colspan="9"><hr class="tbody-hr"/></td></tr></table></td></tr><tr class="table-fn"><td><div>SE-ResNetCount<sub>50</sub> and SE-ResNeXtCount<sub>50/101</sub>, respectively, choose SE-ResNet or SE-ResNeXt as the backbone network and adopt the DASPP module and FFM module given in Figure <a href="../fig1/">1</a>. +SSIM and +MS-SSIM indicate that the objective loss function combines the Euclidean loss with the SSIM or MS-SSIM index.<br/></div></td></tr></table>

Wireless Communications and Mobile Computing

tab5

Table 5

Table 5: SENetCount: An Optimized Encoder-Decoder Architecture with Squeeze-and-Excitation for Crowd Counting