Biomedical Text Categorization Based on Ensemble Pruning and Optimized Topic Modelling

<table class="fixed-width table-group" id="tab10"><tr><td><table class="table"><colgroup><col style="width:11.39em"/><col style="width:3.09em"/><col style="width:3.26em"/><col style="width:3.21em"/><col style="width:3.93em"/><col style="width:5.13em"/></colgroup><tr><td class="thead-hr" colspan="6"><hr/></td></tr><tr class="thead"><td class="align_left">Classification algorithm</td><td class="align_center">oh5</td><td class="align_center">oh10</td><td class="align_center">oh15</td><td class="align_center">ohscal</td><td class="align_center">ohsumed</td></tr><tr><td class="thead-hr" colspan="6"><hr/></td></tr><tr><td class="align_left">NB</td><td class="align_center">0.89</td><td class="align_center">0.82</td><td class="align_center">0.88</td><td class="align_center">0.84</td><td class="align_center">0.48</td></tr><tr><td class="align_left">SVM</td><td class="align_center">0.90</td><td class="align_center">0.83</td><td class="align_center">0.89</td><td class="align_center">0.86</td><td class="align_center">0.51</td></tr><tr><td class="align_left">Bagging+NB</td><td class="align_center">0.90</td><td class="align_center">0.84</td><td class="align_center">0.90</td><td class="align_center">0.84</td><td class="align_center">0.49</td></tr><tr><td class="align_left">Bagging+SVM</td><td class="align_center">0.89</td><td class="align_center">0.86</td><td class="align_center">0.89</td><td class="align_center">0.85</td><td class="align_center">0.51</td></tr><tr><td class="align_left">AdaBoost+NB</td><td class="align_center">0.91</td><td class="align_center">0.84</td><td class="align_center">0.88</td><td class="align_center">0.87</td><td class="align_center">0.52</td></tr><tr><td class="align_left">AdaBoost+SVM</td><td class="align_center">0.89</td><td class="align_center">0.86</td><td class="align_center">0.88</td><td class="align_center">0.87</td><td class="align_center">0.52</td></tr><tr><td class="align_left">RandomSubspace+NB</td><td class="align_center">0.90</td><td class="align_center">0.86</td><td class="align_center">0.88</td><td class="align_center">0.90</td><td class="align_center">0.52</td></tr><tr><td class="align_left">RandomSubspace+SVM</td><td class="align_center">0.90</td><td class="align_center">0.86</td><td class="align_center">0.91</td><td class="align_center">0.90</td><td class="align_center">0.51</td></tr><tr><td class="align_left">Stacking</td><td class="align_center">0.90</td><td class="align_center">0.87</td><td class="align_center">0.91</td><td class="align_center">0.88</td><td class="align_center">0.54</td></tr><tr><td class="align_left">ESM</td><td class="align_center">0.90</td><td class="align_center">0.88</td><td class="align_center">0.92</td><td class="align_center">0.90</td><td class="align_center">0.53</td></tr><tr><td class="align_left">BES</td><td class="align_center">0.93</td><td class="align_center">0.90</td><td class="align_center">0.95</td><td class="align_center">0.93</td><td class="align_center">0.55</td></tr><tr><td class="align_left">LibD3C</td><td class="align_center">0.94</td><td class="align_center">0.92</td><td class="align_center">0.95</td><td class="align_center">0.94</td><td class="align_center">0.56</td></tr><tr><td class="align_left">CDM</td><td class="align_center">0.95</td><td class="align_center">0.93</td><td class="align_center">0.97</td><td class="align_center">0.95</td><td class="align_center">0.57</td></tr><tr><td class="align_left">Proposed scheme</td><td class="align_center">0.97</td><td class="align_center">0.95</td><td class="align_center">0.98</td><td class="align_center">0.96</td><td class="align_center">0.61</td></tr><tr class="table-tr"><td colspan="6"><hr class="tbody-hr"/></td></tr></table></td></tr><tr class="table-fn"><td><div>NB: Naïve Bayes algorithm, SVM: support vector machines, ESM: ensemble selection from libraries of models, BES: Bagging ensemble selection, LibD3C: hybrid ensemble pruning based on k-means and dynamic selection, and CDM: ensemble pruning based on combined diversity measures. </div></td></tr></table>

<div>The macro-averaged F-measure results of methods (with BA-LDA (DB) based representation).</div>

Computational and Mathematical Methods in Medicine

tab10

Table 10

Table 10: Biomedical Text Categorization Based on Ensemble Pruning and Optimized Topic Modelling