Research Article
Machine Learning Model for Imbalanced Cholera Dataset in Tanzania
Table 5
Classifiers with a detailed range of sensitivity, specificity, and balanced accuracy.
| Classifiers | Sensitivity score | Specificity score | Balanced accuracy score |
| Plain Classifiers | XGB | 0.055+-0.08 | 0.995+-0.006 | 0.525+-0.04 | K-NN | 0.095+-0.103 | 0.985+-0.014 | 0.54+-0.053 | DT | 0.119+-0.116 | 0.98+-0.016 | 0.549+-0.061 | RF | 0.166+-0.137 | 0.981+-0.016 | 0.574+-0.072 | ExtraTrees | 0.114+-0.113 | 0.984+-0.015 | 0.549+-0.06 | AdaBoost | 0 | 0.997+-0.005 | 0.498+-0.003 | LDA | 0 | 1 | 0.5 |
| Oversampling Classifiers | XGB | 0.801+-0.148 | 0.742+-0.053 | 0.772+-0.079 | K-NN | 0.656+-0.24 | 0.83+-0.042 | 0.743+-0.123 | DT | 0.579+-0.17 | 0.882+-0.032 | 0.73+-0.09 | RF | 0.632+-0.156 | 0.88+-0.034 | 0.756+-0.085 | ExtraTrees | 0.589+-0.161 | 0.88+-0.032 | 0.734+-0.085 | AdaBoost | 0.708+-0.206 | 0.707+-0.058 | 0.707+-0.103 | LDA | 0.593+-0.23 | 0.594+-0.051 | 0.593+-0.111 |
| PCA Classifiers | XGB | 0.056+-0.096 | 0.9912+-0.01 | 0.524+-0.049 | K-NN | 0.061+-0.09 | 0.989+-0.013 | 0.525+-0.045 | DT | 0.119+-0.117 | 0.983+-0.015 | 0.551+-0.062 | RF | 0.153+-0.121 | 0.983+-0.016 | 0.568+-0.063 | ExtraTrees | 0.114+-0.113 | 0.984+-0.015 | 0.549+-0.06 | AdaBoost | 0 | 0.999+-0.004 | 0.5 | LDA | 0 | 1 | 0.5 |
| PCA/Oversampling Classifiers | XGB | 0.805+-0.169 | 0.73+-0.05 | 0.767+-0.09 | K-NN | 0.705+-0.199 | 0.828+-0.034 | 0.767+-0.105 | DT | 0.596+-0.163 | 0.879+-0.032 | 0.737+-0.086 | RF | 0.645+-0.155 | 0.877+-0.031 | 0.761+-0.082 | ExtraTrees | 0.585+-0.19 | 0.879654+-0.033950 | 0.732+-0.102 | AdaBoost | 0.691+-0.168 | 0.731+-0.040 | 0.711+-0.087 | LDA | 0.534+-0.226 | 0.622+-0.072 | 0.578+-0.117 |
|
|