Reinforcement Learning for Computational Guidance of Launch Vehicle Upper Stage

<table class="table-group" id="tab2"><tr><td><table class="table"><tr><td class="thead-hr" colspan="4"><hr/></td></tr><tr class="thead"><td class="align_left">Parameter</td><td class="align_center">Value</td><td class="align_center">Parameter</td><td class="align_center">Value</td></tr><tr><td class="thead-hr" colspan="4"><hr/></td></tr><tr><td class="align_left">Shape reward coefficient</td><td class="align_center">0.01</td><td class="align_center">Epochs per update</td><td class="align_center">30</td></tr><tr><td class="align_left">Final reward coefficient</td><td class="align_center">1000</td><td class="align_center">Episodes per rollouts</td><td class="align_center">50</td></tr><tr><td class="align_left">Constant positive reward</td><td class="align_center">0.001</td><td class="align_center">Number of iterations</td><td class="align_center">10000</td></tr><tr><td class="align_left">Discount factor</td><td class="align_center">0.995</td><td class="align_center">Total episode</td><td class="align_center">500000</td></tr><tr><td class="align_left">GAE factor</td><td class="align_center">0.98</td><td class="align_left"></td><td class="align_left"></td></tr><tr class="table-tr"><td colspan="4"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

International Journal of Aerospace Engineering

tab2

Table 2

Table 2: Reinforcement Learning for Computational Guidance of Launch Vehicle Upper Stage