Evaluating Word Representation Features in Biomedical Named Entity Recognition Tasks

<table class="table-group" id="tab5"><tr><td><table class="table"><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr class="thead"><td align="left" rowspan="2">System</td><td align="center" colspan="3">BioCreAtIvE II GM (%)</td><td align="center" colspan="3">JNLPBA (%)</td></tr><tr class="thead"><td align="center">Precision</td><td align="center">Recall</td><td align="center"><svg height="11.175" id="M10" style="vertical-align:-0.0pt" version="1.1" viewbox="0 0 10.7 11.175" width="10.7" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink">
<g transform="matrix(.017,-0,0,-.017,.062,11.113)"><path d="M599 650l-18 -160l-30 -2q-2 70 -11 94q-5 16 -26 24t-75 8h-94q-27 0 -33.5 -6.5t-12.5 -32.5l-43 -226h108q52 0 72.5 5t31 18t28.5 52h28l-40 -200h-28q-1 42 -6 56.5t-24.5 21t-70.5 6.5h-108l-32 -177q-13 -65 1 -80.5t88 -22.5l-8 -28h-279l6 28q61 5 77.5 20.5
t29.5 81.5l72 387l7.5 40.5t1 26.5t-4 18t-15.5 10t-24 6t-37 4l8 28h461z" id="x1D439"></path></g>
</svg>-measure</td><td align="center">Precision</td><td align="center">Recall</td><td align="center"><svg height="11.175" id="M11" style="vertical-align:-0.0pt" version="1.1" viewbox="0 0 10.7 11.175" width="10.7" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink">
<g transform="matrix(.017,-0,0,-.017,.062,11.113)"><path d="M599 650l-18 -160l-30 -2q-2 70 -11 94q-5 16 -26 24t-75 8h-94q-27 0 -33.5 -6.5t-12.5 -32.5l-43 -226h108q52 0 72.5 5t31 18t28.5 52h28l-40 -200h-28q-1 42 -6 56.5t-24.5 21t-70.5 6.5h-108l-32 -177q-13 -65 1 -80.5t88 -22.5l-8 -28h-279l6 28q61 5 77.5 20.5
t29.5 81.5l72 387l7.5 40.5t1 26.5t-4 18t-15.5 10t-24 6t-37 4l8 28h461z" id="x1D439"></path></g>
</svg>-measure</td></tr><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr><td align="left">Baseline</td><td align="center">87.31</td><td align="center">69.20</td><td align="center">77.21</td><td align="center">71.37</td><td align="center">68.68</td><td align="center">70.00</td></tr><tr><td align="left">Baseline + WR1</td><td align="center">86.55</td><td align="center">73.18</td><td align="center">79.31</td><td align="center">70.96</td><td align="center">71.44</td><td align="center">71.20</td></tr><tr><td align="left">Baseline + WR2</td><td align="center">87.34</td><td align="center">73.91</td><td align="center">80.07</td><td align="center">71.59</td><td align="center">69.55</td><td align="center">70.55</td></tr><tr><td align="left">Baseline + WR3</td><td align="center">86.56</td><td align="center">72.22</td><td align="center">78.74</td><td align="center">71.11</td><td align="center">69.88</td><td align="center">70.49</td></tr><tr><td align="left">Baseline + WR1 + WR2</td><td align="center">86.56</td><td align="center">75.39</td><td align="center">80.59</td><td align="center">70.99</td><td align="center">71.77</td><td align="center">71.38</td></tr><tr><td align="left">Baseline + WR1 + WR3</td><td align="center">85.77</td><td align="center">74.65</td><td align="center">79.82</td><td align="center">70.77</td><td align="center">71.87</td><td align="center">71.31</td></tr><tr><td align="left">Baseline + WR2 + WR3</td><td align="center">87.03</td><td align="center">74.90</td><td align="center">80.51</td><td align="center">71.19</td><td align="center">70.41</td><td align="center">70.80</td></tr><tr><td align="left">Baseline + WR1 + WR2 + WR3</td><td align="center">86.54</td><td align="center">76.05</td><td align="center">80.96</td><td align="center">70.78</td><td align="center">72.00</td><td align="center">71.39</td></tr><tr class="table-tr"><td colspan="7"><hr class="tbody-hr"/></td></tr></table></td></tr><tr class="table-fn"><td><svg height="13.75" id="M12" style="vertical-align:-0.0pt" version="1.1" viewbox="0 0 7.7375002 13.75" width="7.7375002" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink">
<g transform="matrix(.012,-0,0,-.012,.062,5.525)"><path d="M471 153q-22 -15 -61 -13q-25 31 -45.5 49.5t-56.5 41.5q4 -71 28 -134q-17 -33 -42 -46q-24 12 -42 46q24 63 28 134q-36 -23 -56.5 -41.5t-45.5 -49.5q-36 -2 -61 13q0 28 19 59q65 10 130 43q-65 33 -130 43q-19 31 -19 59q22 15 61 13q25 -31 45.5 -49.5t56.5 -41.5
q-4 71 -28 134q17 33 42 46q24 -12 42 -46q-24 -63 -28 -134q36 23 56.5 41.5t45.5 49.5q36 2 61 -13q0 -28 -19 -59q-65 -10 -130 -43q65 -33 130 -43q19 -31 19 -59z" id="x2217"></path></g>
</svg>WR1, WR2, and WR3 denote three different types of word representation features: clustering-based, distributional, and word embeddings features, respectively.<br/></td></tr></table>

Performance of CRF-based BNER systems when different types of WR features were used.

BioMed Research International

tab5

Table 5

Table 5: Evaluating Word Representation Features in Biomedical Named Entity Recognition Tasks