Optimal Policy Learning for Disease Prevention Using Reinforcement Learning

<table class="table-group" id="tab1"><tr><td><table class="table"><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr class="thead"><td class="align_left" rowspan="2">Algorithm</td><td class="align_center" rowspan="2">Best reward</td><td class="align_center" colspan="5">Optimal policy</td></tr><tr class="thead"><td class="align_center">Year 1</td><td class="align_center">Year 2</td><td class="align_center">Year 3</td><td class="align_center">Year 4</td><td class="align_center">Year 5</td></tr><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr><td class="align_left">Random</td><td class="align_center">174.16</td><td class="align_center">[0.2, 0.7]</td><td class="align_center">[0.6, 0.9]</td><td class="align_center">[0.1, 0.8]</td><td class="align_center">[0.4, 0.6]</td><td class="align_center">[0.3, 0.1]</td></tr><tr><td class="align_left">Q-Learning</td><td class="align_center">228.77</td><td class="align_center">[0.3, 0.1]</td><td class="align_center">[0.3, 0.2]</td><td class="align_center">[0.5, 0.2]</td><td class="align_center">[0.9, 0.5]</td><td class="align_center">[0.5, 0.1]</td></tr><tr><td class="align_left">SARSA</td><td class="align_center">161.74</td><td class="align_center">[0.3, 0.1]</td><td class="align_center">[0.3, 0.1]</td><td class="align_center">[0.3, 0.1]</td><td class="align_center">[0.3, 0.1]</td><td class="align_center">[0.3, 0.1]</td></tr><tr><td class="align_left">DDPG</td><td class="align_center">325.55</td><td class="align_center">[1.0, 0.8]</td><td class="align_center">[0.1, 0.0]</td><td class="align_center">[0.1, 0.8]</td><td class="align_center">[0.6, 1.0]</td><td class="align_center">[0.6, 1.0]</td></tr><tr class="table-tr"><td colspan="7"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The comparison of three reinforcement learning algorithms explained in the paper in terms of best rewards and best policy when the agent is executed for 100 episodes.</div>

Scientific Programming

tab1

Table 1

Table 1: Optimal Policy Learning for Disease Prevention Using Reinforcement Learning