Unbiased Feature Selection in Learning Random Forests for High-Dimensional Data

<table class="table-group" id="tab4"><tr><td><table class="table"><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr class="thead"><td align="left">Dataset </td><td align="center"> Model </td><td align="center"><svg height="9.04777pt" id="M267" style="vertical-align:-0.04981995pt" version="1.1" viewbox="-0.0498162 -8.99795 10.3669 9.04777" width="10.3669pt" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"><g transform="matrix(.0135,0,0,-0.0135,0,0)"><path d="M743 650H503L496 622L527 618C563 613 564 603 532 573C449 495 371 431 323 392C301 374 272 355 246 346L280 522C297 609 300 614 379 622L385 650H135L129 622C209 614 215 609 198 522L124 133C106 39 99 35 23 28L17 0H271L277 28C193 35 192 39 208 133L239 316C264 328 280 325 303 288C368 183 435 90 502 0H652L659 28C602 34 584 43 543 94C495 154 403 283 347 369L574 554C634 603 659 612 735 624L743 650Z" id="g113-76"></path><glyph.data ascent="3473" descent="-2876" horiz-adv-x="755" vert-adv-y="755"></glyph.data></g></svg> = 20 </td><td align="center"><svg height="9.04777pt" id="M268" style="vertical-align:-0.04981995pt" version="1.1" viewbox="-0.0498162 -8.99795 10.3669 9.04777" width="10.3669pt" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"><g transform="matrix(.0135,0,0,-0.0135,0,0)"><path d="M743 650H503L496 622L527 618C563 613 564 603 532 573C449 495 371 431 323 392C301 374 272 355 246 346L280 522C297 609 300 614 379 622L385 650H135L129 622C209 614 215 609 198 522L124 133C106 39 99 35 23 28L17 0H271L277 28C193 35 192 39 208 133L239 316C264 328 280 325 303 288C368 183 435 90 502 0H652L659 28C602 34 584 43 543 94C495 154 403 283 347 369L574 554C634 603 659 612 735 624L743 650Z" id="g113-76"></path><glyph.data ascent="3473" descent="-2876" horiz-adv-x="755" vert-adv-y="755"></glyph.data></g></svg> = 50 </td><td align="center"><svg height="9.04777pt" id="M269" style="vertical-align:-0.04981995pt" version="1.1" viewbox="-0.0498162 -8.99795 10.3669 9.04777" width="10.3669pt" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"><g transform="matrix(.0135,0,0,-0.0135,0,0)"><path d="M743 650H503L496 622L527 618C563 613 564 603 532 573C449 495 371 431 323 392C301 374 272 355 246 346L280 522C297 609 300 614 379 622L385 650H135L129 622C209 614 215 609 198 522L124 133C106 39 99 35 23 28L17 0H271L277 28C193 35 192 39 208 133L239 316C264 328 280 325 303 288C368 183 435 90 502 0H652L659 28C602 34 584 43 543 94C495 154 403 283 347 369L574 554C634 603 659 612 735 624L743 650Z" id="g113-76"></path><glyph.data ascent="3473" descent="-2876" horiz-adv-x="755" vert-adv-y="755"></glyph.data></g></svg> = 80 </td><td align="center"><svg height="9.04777pt" id="M270" style="vertical-align:-0.04981995pt" version="1.1" viewbox="-0.0498162 -8.99795 10.3669 9.04777" width="10.3669pt" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"><g transform="matrix(.0135,0,0,-0.0135,0,0)"><path d="M743 650H503L496 622L527 618C563 613 564 603 532 573C449 495 371 431 323 392C301 374 272 355 246 346L280 522C297 609 300 614 379 622L385 650H135L129 622C209 614 215 609 198 522L124 133C106 39 99 35 23 28L17 0H271L277 28C193 35 192 39 208 133L239 316C264 328 280 325 303 288C368 183 435 90 502 0H652L659 28C602 34 584 43 543 94C495 154 403 283 347 369L574 554C634 603 659 612 735 624L743 650Z" id="g113-76"></path><glyph.data ascent="3473" descent="-2876" horiz-adv-x="755" vert-adv-y="755"></glyph.data></g></svg> = 100 </td><td align="center"><svg height="9.04777pt" id="M271" style="vertical-align:-0.04981995pt" version="1.1" viewbox="-0.0498162 -8.99795 10.3669 9.04777" width="10.3669pt" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"><g transform="matrix(.0135,0,0,-0.0135,0,0)"><path d="M743 650H503L496 622L527 618C563 613 564 603 532 573C449 495 371 431 323 392C301 374 272 355 246 346L280 522C297 609 300 614 379 622L385 650H135L129 622C209 614 215 609 198 522L124 133C106 39 99 35 23 28L17 0H271L277 28C193 35 192 39 208 133L239 316C264 328 280 325 303 288C368 183 435 90 502 0H652L659 28C602 34 584 43 543 94C495 154 403 283 347 369L574 554C634 603 659 612 735 624L743 650Z" id="g113-76"></path><glyph.data ascent="3473" descent="-2876" horiz-adv-x="755" vert-adv-y="755"></glyph.data></g></svg> = 200 </td></tr><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr><td align="left" rowspan="4"> CaltechM3000 </td><td align="center"> xRF </td><td align="center"><b> .995 ± .0</b></td><td align="center"><b> .999 ± .5</b></td><td align="center"><b> 1.00 ± .2</b></td><td align="center"><b> 1.00 ± .1</b></td><td align="center"><b> 1.00 ± .1</b></td></tr><tr><td align="center"> RF </td><td align="center"> .851 ± .7 </td><td align="center"> .817 ± .4 </td><td align="center"> .826 ± 1.2 </td><td align="center"> .865 ± .6 </td><td align="center"> .864 ± 1 </td></tr><tr><td align="center"> wsRF </td><td align="center"> .841 ± 1 </td><td align="center"> .845 ± .8 </td><td align="center"> .834 ± .7 </td><td align="center"> .850 ± .8 </td><td align="center"> .870 ± .9 </td></tr><tr><td align="center"> GRRF </td><td align="center"> .846 ± .1 </td><td align="center"> .860 ± .2 </td><td align="center"> .862 ± .1 </td><td align="center"> .908 ± .1 </td><td align="center"> .923 ± .1 </td></tr><tr><td align="center" colspan="7"><hr/></td></tr><tr><td align="left" rowspan="4">HorseM3000 </td><td align="center"> xRF </td><td align="center"><b> .849 ± .1</b></td><td align="center"><b> .887 ± .0</b></td><td align="center"><b> .895 ± .0</b></td><td align="center"><b> .898 ± .0</b></td><td align="center"><b> .897 ± .0</b></td></tr><tr><td align="center"> RF </td><td align="center"> .637 ± .4 </td><td align="center"> .664 ± .7 </td><td align="center"> .692 ± 1.5 </td><td align="center"> .696 ± .3 </td><td align="center"> .733 ± .9 </td></tr><tr><td align="center"> wsRF </td><td align="center"> .635 ± .8 </td><td align="center"> .687 ± .4 </td><td align="center"> .679 ± .6 </td><td align="center"> .671 ± .4 </td><td align="center"> .718 ± .9 </td></tr><tr><td align="center"> GRRF </td><td align="center"> .786 ± .3 </td><td align="center"> .778 ± .3 </td><td align="center"> .785 ± .8 </td><td align="center"> .699 ± .1 </td><td align="center"> .806 ± .4 </td></tr><tr class="table-tr"><td colspan="7"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

AUC results (mean ± std-dev%) of random forest models against the number of trees <svg height="9.04777pt" id="M266" style="vertical-align:-0.04981995pt" version="1.1" viewbox="-0.0498162 -8.99795 10.3669 9.04777" width="10.3669pt" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"><g transform="matrix(.0135,0,0,-0.0135,0,0)"><path d="M743 650H503L496 622L527 618C563 613 564 603 532 573C449 495 371 431 323 392C301 374 272 355 246 346L280 522C297 609 300 614 379 622L385 650H135L129 622C209 614 215 609 198 522L124 133C106 39 99 35 23 28L17 0H271L277 28C193 35 192 39 208 133L239 316C264 328 280 325 303 288C368 183 435 90 502 0H652L659 28C602 34 584 43 543 94C495 154 403 283 347 369L574 554C634 603 659 612 735 624L743 650Z" id="g113-76"></path><glyph.data ascent="3473" descent="-2876" horiz-adv-x="755" vert-adv-y="755"></glyph.data></g></svg> on the CaltechM3000 and HorseM3000 subdatasets. The bold value in each row indicates the best result.

The Scientific World Journal

tab4

Table 4

Table 4: Unbiased Feature Selection in Learning Random Forests for High-Dimensional Data