SENetCount: An Optimized Encoder-Decoder Architecture with Squeeze-and-Excitation for Crowd Counting

<table class="table-group" id="tab4"><tr><td><table class="table"><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr class="thead"><td class="align_left" rowspan="2">Networks</td><td class="align_center" colspan="2">Part_A</td><td class="align_center" colspan="2">Part_B</td></tr><tr class="thead"><td class="align_center">MAE</td><td class="align_center">RMSE</td><td class="align_center">MAE</td><td class="align_center">RMSE</td></tr><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr><td class="align_left">ResNetCount<sub>50,3W/O</sub></td><td class="align_center">121.4</td><td class="align_center">178.0</td><td class="align_center">11.0</td><td class="align_center">17.6</td></tr><tr><td class="align_left">ResNetCount<sub>50,3</sub></td><td class="align_center">78.3</td><td class="align_center">125.8</td><td class="align_center">8.2</td><td class="align_center">13.6</td></tr><tr><td class="align_left">ResNetCount<sub>50,4</sub></td><td class="align_center">78.0</td><td class="align_center">129.7</td><td class="align_center">8.1</td><td class="align_center">13.7</td></tr><tr><td class="align_left">SE-ResNetCount<sub>50,3W/O</sub></td><td class="align_center">111.9</td><td class="align_center">177.6</td><td class="align_center">11.1</td><td class="align_center">17.3</td></tr><tr><td class="align_left">SE-ResNetCount<sub>50,3</sub></td><td class="align_center">76.0</td><td class="align_center">120.5</td><td class="align_center">7.7</td><td class="align_center">12.2</td></tr><tr><td class="align_left">SE-ResNetCount<sub>50,4</sub></td><td class="align_center">76.8</td><td class="align_center">123.6</td><td class="align_center">8.2</td><td class="align_center">13.5</td></tr><tr><td class="align_left">SE-ResNeXtCount<sub>50,3W/O</sub></td><td class="align_center">114.9</td><td class="align_center">176.4</td><td class="align_center">11.2</td><td class="align_center">15.9</td></tr><tr><td class="align_left">SE-ResNeXtCount<sub>50,3</sub></td><td class="align_center">71.9</td><td class="align_center">118.7</td><td class="align_center">8.0</td><td class="align_center">13.3</td></tr><tr><td class="align_left">SE-ResNeXtCount<sub>50,4</sub></td><td class="align_center">72.1</td><td class="align_center">121.8</td><td class="align_center">8.1</td><td class="align_center">13.2</td></tr><tr class="table-tr"><td colspan="5"><hr class="tbody-hr"/></td></tr></table></td></tr><tr class="table-fn"><td><div>3 indicates that only the first three bottlenecks are selected, and 4 indicates that all the four bottlenecks are chosen. W/O means that the pretraining strategy is not used.<br/></div></td></tr></table>

Wireless Communications and Mobile Computing

tab4

Table 4

Table 4: SENetCount: An Optimized Encoder-Decoder Architecture with Squeeze-and-Excitation for Crowd Counting