Focal CTC Loss for Chinese Optical Character Recognition on Unbalanced Datasets

<div>Convolutional layers (ResNet) which are used to extract image feature sequences. The basic building block is residual learning unit, surrounded by the green dash box.</div>

Complexity

fig3

Figure 3

Figure 3: Focal CTC Loss for Chinese Optical Character Recognition on Unbalanced Datasets