Named Entity Recognition in Chinese Medical Literature Using Pretraining Models

<table class="table-group" id="tab1"><tr><td><table class="table"><tr><td class="thead-hr" colspan="6"><hr/></td></tr><tr class="thead"><td class="align_left">Pretraining model</td><td class="align_center"><i>L</i></td><td class="align_center"><i>H</i></td><td class="align_center"><i>A</i></td><td class="align_center">Pretraining task</td><td class="align_center">Pretraining corpora</td></tr><tr><td class="thead-hr" colspan="6"><hr/></td></tr><tr><td class="align_left">BERT [<a href="/journals/sp/2020/8812754/#B18" target="_blank">18</a>]</td><td class="align_center">12</td><td class="align_center">768</td><td class="align_center">12</td><td class="align_center">Masked Language Model, NSP</td><td class="align_center">Books Corpus, Wikipedia</td></tr><tr><td class="align_left">BERT-WWM [<a href="/journals/sp/2020/8812754/#B20" target="_blank">20</a>]</td><td class="align_center">12</td><td class="align_center">768</td><td class="align_center">12</td><td class="align_center">Whole Word Masking, NSP</td><td class="align_center">Wikipedia</td></tr><tr><td class="align_left">BERT-WWM-EXT [<a href="/journals/sp/2020/8812754/#B20" target="_blank">20</a>]</td><td class="align_center">12</td><td class="align_center">768</td><td class="align_center">12</td><td class="align_center">Whole Word Masking, NSP</td><td class="align_center">General data (Baike, News, and QA), Wikipedia</td></tr><tr><td class="align_left">ERNIE [<a href="/journals/sp/2020/8812754/#B21" target="_blank">21</a>]</td><td class="align_center">12</td><td class="align_center">768</td><td class="align_center">12</td><td class="align_center">Phrase-level and entity-level masking, NSP</td><td class="align_center">Chinese Wikipedia, Baidu Baike, News, and Tieba</td></tr><tr><td class="align_left">ERNIE-tiny [<a href="/journals/sp/2020/8812754/#B22" target="_blank">22</a>]</td><td class="align_center">3</td><td class="align_center">1024</td><td class="align_center">12</td><td class="align_center">Phrase-level and entity-level masking, NSP</td><td class="align_center">Chinese Wikipedia, Baidu Baike, News, and Tieba</td></tr><tr><td class="align_left">RoBERTa [<a href="/journals/sp/2020/8812754/#B23" target="_blank">23</a>]</td><td class="align_center">12</td><td class="align_center">768</td><td class="align_center">12</td><td class="align_center">Dynamic masking</td><td class="align_center">Books Corpus, Wikipedia</td></tr><tr class="table-tr"><td colspan="6"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Parameters, pretraining tasks, and corpora of pretraining models.</div>

Scientific Programming

tab1

Table 1

Table 1: Named Entity Recognition in Chinese Medical Literature Using Pretraining Models