Unsupervised Chunking Based on Graph Propagation from Bilingual Corpus

<table class="table-group" id="tab4"><tr class="table-caption" id="a"><td><b>(a) </b></td></tr><tr><td><table class="table"><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr class="thead"><td align="left">Number of sentence pairs</td><td align="center">Number of seeds</td><td align="center">Number of words</td></tr><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr><td align="left">10,000</td><td align="center">27,940</td><td align="center">31,678</td></tr><tr class="table-tr"><td colspan="3"><hr class="tbody-hr"/></td></tr></table></td></tr><tr class="table-caption" id="b"><td><b>(b) </b></td></tr><tr><td><table class="table"><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr class="thead"><td align="left">Number of sentences </td><td align="center">Number of vertices</td></tr><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr><td align="left">17,617</td><td align="center">185,441</td></tr><tr class="table-tr"><td colspan="2"><hr class="tbody-hr"/></td></tr></table></td></tr><tr class="table-caption" id="c"><td><b>(c) </b></td></tr><tr><td><table class="table"><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr class="thead"><td align="left">Dataset</td><td align="center">Source</td><td align="center">Number of sentences</td></tr><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr><td align="left">Training dataset</td><td align="center">Xinhua 1–321</td><td align="center">7,617</td></tr><tr><td align="left">Testing dataset</td><td align="center">Xinhua 363–403</td><td align="center">912</td></tr><tr class="table-tr"><td colspan="3"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

(a) English-Chinese parallel corpus. (b) Graph instance. (c) Chinese unlabeled dataset: CTB7 corpora.

The Scientific World Journal

tab4

Table 4

Table 4: Unsupervised Chunking Based on Graph Propagation from Bilingual Corpus