Deep Multimodal Fusion Autoencoder for Saliency Prediction of RGB-D Images

<table class="table-group" id="tab1"><tr><td><table class="table"><tr><td class="thead-hr" colspan="11"><hr/></td></tr><tr class="thead"><td class="align_left">Datasets</td><td class="align_center">Criteria</td><td class="align_center">Itti</td><td class="align_center">GBVS</td><td class="align_center">QFT</td><td class="align_center">Fang</td><td class="align_center">Qi</td><td class="align_center">DeepFix</td><td class="align_center">ML-net</td><td class="align_center">DVA</td><td class="align_center">Proposed</td></tr><tr><td class="thead-hr" colspan="11"><hr/></td></tr><tr><td class="align_left" rowspan="4">NUS</td><td class="align_center">CC</td><td class="align_center">0.341</td><td class="align_center">0.396</td><td class="align_center">0.163</td><td class="align_center">0.333</td><td class="align_center">0.371</td><td class="align_center">0.4322</td><td class="align_center">0.446</td><td class="align_center">0.4549</td><td class="align_center">0.5310</td></tr><tr><td class="align_center">KLDiv</td><td class="align_center">1.457</td><td class="align_center">1.374</td><td class="align_center">1.795</td><td class="align_center">1.560</td><td class="align_center">1.505</td><td class="align_center">1.8138</td><td class="align_center">1.780</td><td class="align_center">2.4349</td><td class="align_center">1.2323</td></tr><tr><td class="align_center">AUC</td><td class="align_center">0.788</td><td class="align_center">0.824</td><td class="align_center">0.682</td><td class="align_center">0.795</td><td class="align_center">0.806</td><td class="align_center">0.7699</td><td class="align_center">0.766</td><td class="align_center">0.7236</td><td class="align_center">0.8501</td></tr><tr><td class="align_center">NSS</td><td class="align_center">1.236</td><td class="align_center">1.441</td><td class="align_center">0.568</td><td class="align_center">1.209</td><td class="align_center">1.357</td><td class="align_center">1.6608</td><td class="align_center">1.821</td><td class="align_center">1.7962</td><td class="align_center">2.1195</td></tr><tr><td class="align_left" colspan="11"><hr/></td></tr><tr><td class="align_left" rowspan="4">NCTU</td><td class="align_center">CC</td><td class="align_center">0.449</td><td class="align_center">0.533</td><td class="align_center">0.292</td><td class="align_center">0.542</td><td class="align_center">0.595</td><td class="align_center">0.7974</td><td class="align_center">0.696</td><td class="align_center">0.6834</td><td class="align_center">0.8034</td></tr><tr><td class="align_center">KLDiv</td><td class="align_center">0.738</td><td class="align_center">0.619</td><td class="align_center">0.893</td><td class="align_center">0.674</td><td class="align_center">0.616</td><td class="align_center">1.3083</td><td class="align_center">0.900</td><td class="align_center">1.1045</td><td class="align_center">0.3593</td></tr><tr><td class="align_center">AUC</td><td class="align_center">0.753</td><td class="align_center">0.789</td><td class="align_center">0.698</td><td class="align_center">0.806</td><td class="align_center">0.816</td><td class="align_center">0.8650</td><td class="align_center">0.835</td><td class="align_center">0.8035</td><td class="align_center">0.8671</td></tr><tr><td class="align_center">NSS</td><td class="align_center">0.978</td><td class="align_center">1.184</td><td class="align_center">0.695</td><td class="align_center">1.264</td><td class="align_center">1.373</td><td class="align_center">1.8575</td><td class="align_center">1.588</td><td class="align_center">1.5546</td><td class="align_center">1.8405</td></tr><tr class="table-tr"><td colspan="11"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The evaluation results of various saliency models.</div>

Computational Intelligence and Neuroscience

tab1

Table 1

Table 1: Deep Multimodal Fusion Autoencoder for Saliency Prediction of RGB-D Images