The Study of Reinforcement Learning for Traffic Self-Adaptive Control under Multiagent Markov Game Environment

<table class="table-group" id="tab1"><tr><td><table class="table"><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr class="thead"><td align="left">Local state of TSCA 5</td><td align="center">1, 1, 2, 1</td><td align="center">1, 1, 2, 2</td><td align="center">1, 1, 2, 3</td><td align="center">1, 1, 3, 1</td></tr><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr><td align="left">Max <i>Q </i></td><td align="center">231.4</td><td align="center">278.9</td><td align="center">297.4</td><td align="center">211.8</td></tr><tr><td align="left">Timing</td><td align="center">60</td><td align="center">30</td><td align="center">25</td><td align="center">25</td></tr><tr class="table-tr"><td colspan="5"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

The learned <i>Q</i>-values of TSCA 5 in specified state.

Mathematical Problems in Engineering

tab1

Table 1

Table 1: The Study of Reinforcement Learning for Traffic Self-Adaptive Control under Multiagent Markov Game Environment