An Efficient Multiscale Pyramid Attention Network for Face Detection in Surveillance Images

<table class="table-group" id="tab1"><tr><td><table class="table"><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr class="thead"><td class="align_left">Stage i</td><td class="align_center">Operator</td><td class="align_center">Resolution</td><td class="align_center">Channels</td><td class="align_center">Layers</td></tr><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr><td class="align_left">1</td><td class="align_center">Conv3 × 3</td><td class="align_center">512 × 512</td><td class="align_center">45</td><td class="align_center">1</td></tr><tr><td class="align_left">2</td><td class="align_center">MBConv1</td><td class="align_center">256 × 256</td><td class="align_center">22</td><td class="align_center">1</td></tr><tr><td class="align_left">3</td><td class="align_center">MBConv6</td><td class="align_center">256 × 256</td><td class="align_center">24</td><td class="align_center">4</td></tr><tr><td class="align_left">4</td><td class="align_center">MBConv6</td><td class="align_center">128 × 128</td><td class="align_center">40</td><td class="align_center">4</td></tr><tr><td class="align_left">5</td><td class="align_center">MBConv6</td><td class="align_center">128 × 128</td><td class="align_center">80</td><td class="align_center">5</td></tr><tr><td class="align_left">6</td><td class="align_center">MBConv6</td><td class="align_center">64 × 64</td><td class="align_center">112</td><td class="align_center">5</td></tr><tr><td class="align_left">7</td><td class="align_center">MBConv6</td><td class="align_center">64 × 64</td><td class="align_center">192</td><td class="align_center">7</td></tr><tr><td class="align_left">8</td><td class="align_center">MBConv6</td><td class="align_center">32 × 32</td><td class="align_center">320</td><td class="align_center">2</td></tr><tr><td class="align_left">9</td><td class="align_center">Conv1 × 1 and pooling and FC</td><td class="align_center">32 × 32</td><td class="align_center">1280</td><td class="align_center">1</td></tr><tr class="table-tr"><td colspan="5"><hr class="tbody-hr"/></td></tr></table></td></tr><tr class="table-fn"><td><div>MBConv denotes mobile inverted convolutional bottleneck.<br/></div></td></tr></table>

Security and Communication Networks

tab1

Table 1

Table 1: An Efficient Multiscale Pyramid Attention Network for Face Detection in Surveillance Images