Recognition and Evaluation of Clinical Section Headings in Clinical Documents Using Token-Based Formulation with Conditional Random Fields

<table class="table-group" id="tab5"><tr><td><table class="table"><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr class="thead"><td align="left">Dataset</td><td align="center">Configuration</td><td align="center"><svg height="8.68572pt" id="M28" style="vertical-align:-0.0498209pt" version="1.1" viewbox="-0.0498162 -8.6359 8.15071 8.68572" width="8.15071pt" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"><g transform="matrix(.013,0,0,-0.013,0,0)"><path d="M600 480C600 590 528 650 384 650H143L137 622C222 614 225 607 210 531L130 127C113 41 106 36 23 28L17 0H294L300 28C204 36 195 42 212 127L243 284L314 263C327 263 339 263 352 264C465 271 600 337 600 480ZM508 481C508 351 402 304 329 304C289 304 265 311 250 317L295 559C302 594 310 606 323 611C335 616 350 619 367 619C455 619 508 573 508 481Z" id="g113-81"></path><glyph.data ascent="3473" descent="-2876" horiz-adv-x="617" vert-adv-y="617"></glyph.data></g></svg> (%)</td><td align="center"><svg height="8.8423pt" id="M29" style="vertical-align:-0.2064009pt" version="1.1" viewbox="-0.0498162 -8.6359 8.28119 8.8423" width="8.28119pt" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"><g transform="matrix(.013,0,0,-0.013,0,0)"><path d="M610 18C585 26 567 34 540 68C517 97 499 128 476 171C452 215 425 276 413 304C496 332 570 394 570 494C570 555 545 595 509 619S419 650 364 650H139L133 622C216 615 219 612 203 527L129 132C112 40 105 36 23 28L17 0H279L285 28C199 34 194 40 211 132L239 284H284C320 284 334 275 351 236C374 182 394 140 420 93C459 23 495 -1 592 -8H600L610 18ZM480 485C480 424 449 372 403 342C374 323 338 316 293 316H245L291 562C296 589 301 601 311 608S337 618 358 618C432 618 480 575 480 485Z" id="g113-83"></path><glyph.data ascent="3473" descent="-2876" horiz-adv-x="627" vert-adv-y="627"></glyph.data></g></svg> (%)</td><td align="center"><svg height="8.68572pt" id="M30" style="vertical-align:-0.0498209pt" version="1.1" viewbox="-0.0498162 -8.6359 8.02022 8.68572" width="8.02022pt" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"><g transform="matrix(.013,0,0,-0.013,0,0)"><path d="M584 650H137L131 622C214 614 217 612 200 521L125 127C109 41 101 35 23 28L17 0H288L294 28C201 35 193 42 209 128L242 309H348C440 309 442 300 443 226H471L510 422H482C452 354 449 348 357 348H251L295 575C302 609 304 615 338 615H426C502 615 517 604 526 581C534 560 536 524 537 492L565 494C574 554 583 631 584 650Z" id="g113-71"></path><glyph.data ascent="3473" descent="-2876" horiz-adv-x="607" vert-adv-y="607"></glyph.data></g></svg> (%)</td></tr><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr><td align="left" rowspan="8">Set 2</td><td align="center">Dict. method 1 (SecTag)</td><td align="center">19.9</td><td align="center">79.31</td><td align="center">31.82</td></tr><tr><td align="center">Dict. method 1 (set 1)</td><td align="center">52.18</td><td align="center">94.04</td><td align="center">67.12</td></tr><tr><td align="center">Dict. method 1 (SecTag + set 1)</td><td align="center">23.19</td><td align="center"><b>94.99</b></td><td align="center">33.47</td></tr><tr><td align="center">Dict. method 2 (SecTag)</td><td align="center">41.19</td><td align="center">79.31</td><td align="center">54.22</td></tr><tr><td align="center">Dict. method 2 (set 1)</td><td align="center"><b>75.5</b></td><td align="center">94.04</td><td align="center"><b>83.76</b></td></tr><tr><td align="center">Dict. method 2 (SecTag + set 1)</td><td align="center">45.33</td><td align="center"><b>94.99</b></td><td align="center">61.37</td></tr><tr><td align="center">Sentence-based formulation (ME)</td><td align="center">81.54</td><td align="center">82.16</td><td align="center">81.85</td></tr><tr><td align="center">Token-based formulation (CRF)</td><td align="center"><b>95.48</b></td><td align="center">92.66</td><td align="center"><b>94.05</b></td></tr><tr><td align="center" colspan="5"><hr/></td></tr><tr><td align="left" rowspan="8">Test</td><td align="center">Dict. method 1 (SecTag)</td><td align="center">21.15</td><td align="center">80.23</td><td align="center">33.47</td></tr><tr><td align="center">Dict. method 1 (set 1 + set 2)</td><td align="center">54.13</td><td align="center">94.87</td><td align="center">68.93</td></tr><tr><td align="center">Dict. method 1 (SecTag + set 1 + set 2)</td><td align="center">24.38</td><td align="center"><b>95.48</b></td><td align="center">38.84</td></tr><tr><td align="center">Dict. method 2 (SecTag)</td><td align="center">41.72</td><td align="center">80.23</td><td align="center">54.89</td></tr><tr><td align="center">Dict. method 2 (set 1 + set 2)</td><td align="center"><b>76.37</b></td><td align="center">94.84</td><td align="center"><b>84.6</b></td></tr><tr><td align="center">Dict. method 2 (SecTag + set 1 + set 2)</td><td align="center">45.59</td><td align="center"><b>95.48</b></td><td align="center">61.71</td></tr><tr><td align="center">Sentence-based formulation (ME)</td><td align="center">85.46</td><td align="center">85.54</td><td align="center">85.5</td></tr><tr><td align="center">Token-based formulation (CRF)</td><td align="center"><b>96.04</b></td><td align="center">92.4</td><td align="center"><b>94.19</b></td></tr><tr class="table-tr"><td colspan="5"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

Performance comparison among different methods.

BioMed Research International

tab5

Table 5

Table 5: Recognition and Evaluation of Clinical Section Headings in Clinical Documents Using Token-Based Formulation with Conditional Random Fields