Phenonizer: A Fine-Grained Phenotypic Named Entity Recognizer for Chinese Clinical Texts

<table class="table-group" id="tab9"><tr><td><table class="table"><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr class="thead"><td class="align_left">Training dataset</td><td class="align_center" colspan="3">TCM-HB</td><td class="align_center" colspan="3">TCM-HN</td></tr><tr class="thead"><td class="align_left">Models</td><td class="align_center">Precision</td><td class="align_center">Recall</td><td class="align_center">F1-score</td><td class="align_center">Precision</td><td class="align_center">Recall</td><td class="align_center">F1-score</td></tr><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr><td class="align_left">BiLSTM-CRF</td><td class="align_center">0.7682</td><td class="align_center">0.7865</td><td class="align_center">0.7772</td><td class="align_center">0.6512</td><td class="align_center">0.5865</td><td class="align_center">0.6171</td></tr><tr><td class="align_left">GloVe<sub>Wiki</sub>-BiLSTM-CRF</td><td class="align_center">0.7701</td><td class="align_center">0.7870</td><td class="align_center">0.7785</td><td class="align_center">0.6510</td><td class="align_center">0.6097</td><td class="align_center">0.6297</td></tr><tr><td class="align_left">GloVe<sub>Medical</sub>-BiLSTM-CRF</td><td class="align_center">0.7705</td><td class="align_center">0.7957</td><td class="align_center">0.7829</td><td class="align_center">0.6575</td><td class="align_center">0.6104</td><td class="align_center">0.6331</td></tr><tr><td class="align_left">W2V<sub>Wiki</sub>-BiLSTM-CRF</td><td class="align_center">0.7686</td><td class="align_center">0.7964</td><td class="align_center">0.7822</td><td class="align_center">0.6436</td><td class="align_center">0.6261</td><td class="align_center">0.6347</td></tr><tr><td class="align_left">W2V<sub>Medical</sub>-BiLSTM-CRF</td><td class="align_center">0.7734</td><td class="align_center">0.7996</td><td class="align_center">0.7863</td><td class="align_center">0.6623</td><td class="align_center">0.6139</td><td class="align_center">0.6372</td></tr><tr><td class="align_left">BERT-CRF</td><td class="align_center">0.7719</td><td class="align_center">0.8179</td><td class="align_center">0.7943</td><td class="align_center">0.6566</td><td class="align_center">0.6198</td><td class="align_center">0.6377</td></tr><tr><td class="align_left">BERT-BiLSTM</td><td class="align_center">0.7688</td><td class="align_center">0.8145</td><td class="align_center">0.7910</td><td class="align_center">0.6400</td><td class="align_center">0.6406</td><td class="align_center">0.6403</td></tr><tr><td class="align_left">Phenonizer</td><td class="align_center">0.7727</td><td class="align_center">0.8189</td><td class="align_center">0.7952</td><td class="align_center">0.6438</td><td class="align_center">0.6446</td><td class="align_center">0.6442</td></tr><tr class="table-tr"><td colspan="7"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The symptom extraction performance of models on heterogenous data (TCM-HB).</div>

BioMed Research International

tab9

Table 9

Table 9: Phenonizer: A Fine-Grained Phenotypic Named Entity Recognizer for Chinese Clinical Texts