Minimizing the Cost of Spatiotemporal Searches Based on Reinforcement Learning with Probabilistic States

<table class="table-group" id="tab3"><tr><td><table class="table"><tr><td class="thead-hr" colspan="8"><hr/></td></tr><tr class="thead"><td class="align_left">Start moment</td><td class="align_center">8 : 00</td><td class="align_center">10 : 00</td><td class="align_center">12 : 00</td><td class="align_center">14 : 00</td><td class="align_center">16 : 00</td><td class="align_center">18 : 00</td><td class="align_center">20 : 00</td></tr><tr><td class="thead-hr" colspan="8"><hr/></td></tr><tr><td class="align_left">α = 1,γ = 0.97</td><td class="align_center">34.38</td><td class="align_center">35.05</td><td class="align_center">36.51</td><td class="align_center">34.86</td><td class="align_center">35.57</td><td class="align_center">32.44</td><td class="align_center">36.61</td></tr><tr><td class="align_left">α = 1,γ = 0.99</td><td class="align_center">33.25</td><td class="align_center">33.42</td><td class="align_center">35.01</td><td class="align_center">33.27</td><td class="align_center">34.31</td><td class="align_center">30.46</td><td class="align_center">35.11</td></tr><tr><td class="align_left">α = 1,γ =1.00</td><td class="align_center">32.81</td><td class="align_center">32.90</td><td class="align_center">34.85</td><td class="align_center">32.72</td><td class="align_center">34.06</td><td class="align_center">30.15</td><td class="align_center">34.97</td></tr><tr><td class="align_left">α = 1,γ =1.01</td><td class="align_center">33.59</td><td class="align_center">32.95</td><td class="align_center">34.91</td><td class="align_center">33.08</td><td class="align_center">33.72</td><td class="align_center">30.18</td><td class="align_center">35.14</td></tr><tr><td class="align_left">α = 1,γ =1.03</td><td class="align_center">33.15</td><td class="align_center">33.19</td><td class="align_center">35.79</td><td class="align_center">33.24</td><td class="align_center">34.10</td><td class="align_center">30.36</td><td class="align_center">35.13</td></tr><tr><td class="align_left">α = 1,γ =1.05</td><td class="align_center">33.68</td><td class="align_center">33.64</td><td class="align_center">36.17</td><td class="align_center">33.92</td><td class="align_center">34.96</td><td class="align_center">31.21</td><td class="align_center">35.79</td></tr><tr class="table-tr"><td colspan="8"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Accumulative search cost of QDP with different discount rates.</div>

Wireless Communications and Mobile Computing

tab3

Table 3

Table 3: Minimizing the Cost of Spatiotemporal Searches Based on Reinforcement Learning with Probabilistic States