Deep Ensemble Reinforcement Learning with Multiple Deep Deterministic Policy Gradient Algorithm

<table class="table-group" id="tab4"><tr><td><table class="table"><tr><td class="thead-hr" colspan="4"><hr/></td></tr><tr class="thead"><td class="align_left">Policy</td><td class="align_center">Steps</td><td class="align_center">Total reward (points)</td><td class="align_center">Complete one lap</td></tr><tr><td class="thead-hr" colspan="4"><hr/></td></tr><tr><td class="align_left">Subpolicy1</td><td class="align_center">246</td><td class="align_center">16690.60</td><td class="align_center">No</td></tr><tr><td class="align_left">Subpolicy2</td><td class="align_center">246</td><td class="align_center">15413.12</td><td class="align_center">No</td></tr><tr><td class="align_left">Subpolicy3</td><td class="align_center">102</td><td class="align_center">−1252.46</td><td class="align_center">No</td></tr><tr><td class="align_left">Aggregated policy</td><td class="align_center">457</td><td class="align_center">31603.37</td><td class="align_center">Yes</td></tr><tr class="table-tr"><td colspan="4"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Performance comparison of the aggregated policy and subpolicies.</div>

Mathematical Problems in Engineering

tab4

Table 4

Table 4: Deep Ensemble Reinforcement Learning with Multiple Deep Deterministic Policy Gradient Algorithm