A Comprehensive Survey of Abstractive Text Summarization Based on Deep Learning

<table class="table-group" id="tab2"><tr><td><table class="table"><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr class="thead"><td class="align_left">Dataset</td><td class="align_center">#Document</td><td class="align_center">Language</td><td class="align_center">#Ground-truth summary</td><td class="align_center">Summary length</td></tr><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr><td class="align_left">DUC 2001</td><td class="align_center">60 × 10</td><td class="align_center">Eng.</td><td class="align_center">3 per cluster</td><td class="align_center">50, 100, 200, 400 tokens</td></tr><tr><td class="align_left">DUC 2002</td><td class="align_center">60 × 10</td><td class="align_center">Eng.</td><td class="align_center">128</td><td class="align_center">10, 50, 100, 200 tokens</td></tr><tr><td class="align_left">DUC 2003</td><td class="align_center">60 × 10, 30 × 25</td><td class="align_center">Eng.</td><td class="align_center">128</td><td class="align_center">200, 400 tokens</td></tr><tr><td class="align_left">DUC 2004</td><td class="align_center">100 × 10</td><td class="align_center">Ara. &amp; Eng.</td><td class="align_center">4 per cluster</td><td class="align_center">100 tokens</td></tr><tr><td class="align_left">DUC 2005</td><td class="align_center">50 × 32</td><td class="align_center">Eng.</td><td class="align_center">4 per cluster</td><td class="align_center">665 bytes</td></tr><tr><td class="align_left">DUC 2006</td><td class="align_center">50 × 25</td><td class="align_center">Eng.</td><td class="align_center">4 per cluster</td><td class="align_center">250 tokens</td></tr><tr><td class="align_left">DUC 2007</td><td class="align_center">25 × 10</td><td class="align_center">Eng.</td><td class="align_center">4 per cluster</td><td class="align_center">250 tokens</td></tr><tr><td class="align_left">TAC 2008</td><td class="align_center">48 × 20</td><td class="align_center">Eng.</td><td class="align_center">4 per cluster</td><td class="align_center">250 tokens</td></tr><tr><td class="align_left">TAC 2009</td><td class="align_center">44 × 20</td><td class="align_center">Eng.</td><td class="align_center">4 per cluster</td><td class="align_center">250 tokens</td></tr><tr><td class="align_left">TAC 2010</td><td class="align_center">46 × 20</td><td class="align_center">Eng.</td><td class="align_center">8 per cluster</td><td class="align_center">100 tokens</td></tr><tr><td class="align_left">TAC 2011</td><td class="align_center">44 × 20</td><td class="align_center">Eng.</td><td class="align_center">8 per cluster</td><td class="align_center">100 tokens</td></tr><tr class="table-tr"><td colspan="5"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The statistics of <i>DUC/TAC</i> datasets.</div>

Computational Intelligence and Neuroscience

tab2

Table 2

Table 2: A Comprehensive Survey of Abstractive Text Summarization Based on Deep Learning