Deep Ensemble Reinforcement Learning with Multiple Deep Deterministic Policy Gradient Algorithm

<table class="table-group" id="tab1"><tr><td><table class="table"><tr><td class="thead-hr" colspan="4"><hr/></td></tr><tr class="thead"><td class="align_left">Policy</td><td class="align_center">Episodes</td><td class="align_center">Total reward</td><td class="align_center">Average reward</td></tr><tr><td class="thead-hr" colspan="4"><hr/></td></tr><tr><td class="align_left">Subpolicy1</td><td class="align_center">20</td><td class="align_center">720.69</td><td class="align_center">36.03</td></tr><tr><td class="align_left">Subpolicy2</td><td class="align_center">20</td><td class="align_center">538.28</td><td class="align_center">26.91</td></tr><tr><td class="align_left">Subpolicy3</td><td class="align_center">20</td><td class="align_center">463.98</td><td class="align_center">23.20</td></tr><tr><td class="align_left">Aggregated policy</td><td class="align_center">20</td><td class="align_center">829.17</td><td class="align_center">41.46</td></tr><tr class="table-tr"><td colspan="4"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Performance comparison of subpolicies and the aggregated policy.</div>

Mathematical Problems in Engineering

tab1

Table 1

Table 1: Deep Ensemble Reinforcement Learning with Multiple Deep Deterministic Policy Gradient Algorithm