Adaptive Traffic Signal Control Model on Intersections Based on Deep Reinforcement Learning

<table class="table-group" id="tab5"><tr><td><table class="table"><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr class="thead"><td class="align_left">SL no.</td><td class="align_center">Method</td><td class="align_center">Reward</td><td class="align_center">Average travel time (s)</td><td class="align_center">Average speed (m/s)</td></tr><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr><td class="align_left" rowspan="5">1</td><td class="align_center">DQN (ours)</td><td class="align_center">2.54</td><td class="align_center">438.26</td><td class="align_center">2.49</td></tr><tr><td class="align_center">DQN (base)</td><td class="align_center">2.42</td><td class="align_center">486.95</td><td class="align_center">2.21</td></tr><tr><td class="align_center"><i>Q</i>-learning</td><td class="align_center">1.49</td><td class="align_center">752.17</td><td class="align_center">1.28</td></tr><tr><td class="align_center">LQF</td><td class="align_center">2.37</td><td class="align_center">496.80</td><td class="align_center">1.93</td></tr><tr><td class="align_center">Webster</td><td class="align_center">2.05</td><td class="align_center">528.13</td><td class="align_center">1.88</td></tr><tr><td class="align_left" colspan="5"><hr/></td></tr><tr><td class="align_left" rowspan="5">2</td><td class="align_center">DQN (ours)</td><td class="align_center">2.74</td><td class="align_center">418.11</td><td class="align_center">2.57</td></tr><tr><td class="align_center">DQN (base)</td><td class="align_center">2.51</td><td class="align_center">498.69</td><td class="align_center">2.16</td></tr><tr><td class="align_center"><i>Q</i>-learning</td><td class="align_center">1.68</td><td class="align_center">701.82</td><td class="align_center">1.38</td></tr><tr><td class="align_center">LQF</td><td class="align_center">−0.02</td><td class="align_center">816.29</td><td class="align_center">1.18</td></tr><tr><td class="align_center">Webster</td><td class="align_center">1.71</td><td class="align_center">644.27</td><td class="align_center">1.57</td></tr><tr><td class="align_left" colspan="5"><hr/></td></tr><tr><td class="align_left" rowspan="5">3</td><td class="align_center">DQN (ours)</td><td class="align_center">2.78</td><td class="align_center">391.01</td><td class="align_center">2.64</td></tr><tr><td class="align_center">DQN (base)</td><td class="align_center">2.24</td><td class="align_center">573.16</td><td class="align_center">1.83</td></tr><tr><td class="align_center"><i>Q</i>-learning</td><td class="align_center">1.71</td><td class="align_center">681.12</td><td class="align_center">1.44</td></tr><tr><td class="align_center">LQF</td><td class="align_center">1.28</td><td class="align_center">827.84</td><td class="align_center">1.15</td></tr><tr><td class="align_center">Webster</td><td class="align_center">1.75</td><td class="align_center">588.22</td><td class="align_center">1.71</td></tr><tr class="table-tr"><td colspan="5"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Performance in multi-intersection case. Travel time: the lower the better; other measures: the higher the better.</div>

Journal of Advanced Transportation

tab5

Table 5

Table 5: Adaptive Traffic Signal Control Model on Intersections Based on Deep Reinforcement Learning