Investigating the Effects of Hyperparameters in Quantum-Enhanced Deep Reinforcement Learning

<table class="table-group" id="tab7"><tr><td><table class="table"><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr class="thead"><td class="align_left">Episode</td><td class="align_center">799</td><td class="align_center">849</td><td class="align_center">899</td><td class="align_center">949</td><td class="align_center">999</td><td class="align_center">Alpha</td></tr><tr><td class="thead-hr" colspan="7"><hr/></td></tr><tr><td class="align_left" rowspan="4">Reward</td><td class="align_center">−0.24</td><td class="align_center">−0.24</td><td class="align_center">−0.26</td><td class="align_center">0.95</td><td class="align_center">0.95</td><td class="align_center">←0.1</td></tr><tr><td class="align_center">0.95</td><td class="align_center">0.95</td><td class="align_center">0.95</td><td class="align_center">0.95</td><td class="align_center">0.95</td><td class="align_center">←0.2</td></tr><tr><td class="align_center">0.95</td><td class="align_center">0.95</td><td class="align_center">0.95</td><td class="align_center">0.95</td><td class="align_center">0.95</td><td class="align_center">←0.3</td></tr><tr><td class="align_center">0.95</td><td class="align_center">0.95</td><td class="align_center">0.95</td><td class="align_center">0.95</td><td class="align_center">0.95</td><td class="align_center">←0.4</td></tr><tr><td class="align_left" colspan="7"><hr/></td></tr><tr><td class="align_left" rowspan="4">Timesteps</td><td class="align_center">8</td><td class="align_center">8</td><td class="align_center">7</td><td class="align_center">6</td><td class="align_center">6</td><td class="align_center">←0.1</td></tr><tr><td class="align_center">6</td><td class="align_center">6</td><td class="align_center">6</td><td class="align_center">6</td><td class="align_center">6</td><td class="align_center">←0.2</td></tr><tr><td class="align_center">6</td><td class="align_center">6</td><td class="align_center">6</td><td class="align_center">6</td><td class="align_center">6</td><td class="align_center">←0.3</td></tr><tr><td class="align_center">6</td><td class="align_center">6</td><td class="align_center">6</td><td class="align_center">6</td><td class="align_center">6</td><td class="align_center">←0.4</td></tr><tr class="table-tr"><td colspan="7"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>The reward and timestep of the agent for the last 200 episodes.</div>

Quantum Engineering

tab7

Table 7

Table 7: Investigating the Effects of Hyperparameters in Quantum-Enhanced Deep Reinforcement Learning