A Chinese Lip-Reading System Based on Convolutional Block Attention Module

<table class="table-group" id="tab1"><tr><td><table class="table"><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr class="thead"><td class="align_left">Model</td><td class="align_center">Prams (M)</td><td class="align_center">Top-1 accuracy (%)</td></tr><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr><td class="align_left">Vgg16 + LSTM + Attention</td><td class="align_center">144.4</td><td class="align_center">95.2</td></tr><tr><td class="align_left">Vgg16 + GRU + Attention</td><td class="align_center">142.4</td><td class="align_center">95.3</td></tr><tr><td class="align_left">InceptionV3 + LSTM + Attention</td><td class="align_center">31.9</td><td class="align_center">98.2</td></tr><tr><td class="align_left">InceptionV3 + GRU + Attention</td><td class="align_center">29.9</td><td class="align_center">99.1</td></tr><tr><td class="align_left">ResNet50 + LSTM + Attention</td><td class="align_center">33.6</td><td class="align_center">98.2</td></tr><tr><td class="align_left">ResNet50 + GRU + Attention</td><td class="align_center">31.6</td><td class="align_center">99.3</td></tr><tr><td class="align_left">ResNet101 + LSTM + Attention</td><td class="align_center">52.6</td><td class="align_center">97.3</td></tr><tr><td class="align_left">ResNet101 + GRU + Attention</td><td class="align_center">50.6</td><td class="align_center">99.6</td></tr><tr><td class="align_left">ResNet152 + LSTM + Attention</td><td class="align_center">68.3</td><td class="align_center">98.4</td></tr><tr><td class="align_left">ResNet152 + GRU + Attention</td><td class="align_center">66.3</td><td class="align_center">99.8</td></tr><tr><td class="align_left">ResNet50 + CBAM + LSTM + Attention</td><td class="align_center">36.1</td><td class="align_center">98.7</td></tr><tr><td class="align_left">ResNet50 + CBAM + GRU + Attention</td><td class="align_center">34.1</td><td class="align_center">99.6</td></tr><tr class="table-tr"><td colspan="3"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

Mathematical Problems in Engineering

tab1

Table 1

Table 1: A Chinese Lip-Reading System Based on Convolutional Block Attention Module