Adaptive Traffic Signal Control Model on Intersections Based on Deep Reinforcement Learning

<table class="table-group" id="tab3"><tr><td><table class="table"><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr class="thead"><td class="align_left">SL no.</td><td class="align_center">Method</td><td class="align_center">Reward</td><td class="align_center">Average travel time (s)</td><td class="align_center">Average speed (m/s)</td></tr><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr><td class="align_left" rowspan="4">1</td><td class="align_center">DQN (ours)</td><td class="align_center">1.93</td><td class="align_center">222.51</td><td class="align_center">2.29</td></tr><tr><td class="align_center"><i>Q</i>-learning</td><td class="align_center">1.90</td><td class="align_center">228.42</td><td class="align_center">2.26</td></tr><tr><td class="align_center">LQF</td><td class="align_center">1.85</td><td class="align_center">230.66</td><td class="align_center">2.24</td></tr><tr><td class="align_center">Webster</td><td class="align_center">1.66</td><td class="align_center">240.96</td><td class="align_center">1.84</td></tr><tr><td class="align_left" colspan="5"><hr/></td></tr><tr><td class="align_left" rowspan="4">2</td><td class="align_center">DQN (ours)</td><td class="align_center">5.02</td><td class="align_center">89.31</td><td class="align_center">4.83</td></tr><tr><td class="align_center"><i>Q</i>-learning</td><td class="align_center">4.68</td><td class="align_center">97.55</td><td class="align_center">4.52</td></tr><tr><td class="align_center">LQF</td><td class="align_center">0.08</td><td class="align_center">170.93</td><td class="align_center">2.63</td></tr><tr><td class="align_center">Webster</td><td class="align_center">2.42</td><td class="align_center">166.61</td><td class="align_center">2.24</td></tr><tr><td class="align_left" colspan="5"><hr/></td></tr><tr><td class="align_left" rowspan="4">3</td><td class="align_center">DQN (ours)</td><td class="align_center">3.96</td><td class="align_center">113.57</td><td class="align_center">3.51</td></tr><tr><td class="align_center"><i>Q</i>-learning</td><td class="align_center">3.54</td><td class="align_center">118.98</td><td class="align_center">3.37</td></tr><tr><td class="align_center">LQF</td><td class="align_center">2.39</td><td class="align_center">154.85</td><td class="align_center">2.43</td></tr><tr><td class="align_center">Webster</td><td class="align_center">2.54</td><td class="align_center">163.89</td><td class="align_center">2.33</td></tr><tr class="table-tr"><td colspan="5"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Performance in single-intersection case. Travel time: the lower the better; other measures: the higher the better.</div>

Journal of Advanced Transportation

tab3

Table 3

Table 3: Adaptive Traffic Signal Control Model on Intersections Based on Deep Reinforcement Learning