IoT-Based Reinforcement Learning Using Probabilistic Model for Determining Extensive Exploration through Computational Intelligence for Next-Generation Techniques

<table class="table-group" id="tab3"><tr><td><table class="table"><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr class="thead"><td class="align_center" colspan="2">Variable settings</td><td class="align_center">DQN</td><td class="align_center">BDQN</td><td class="align_center">BBDQN</td></tr><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr><td class="align_left" rowspan="3"><i>K</i> = 10</td><td class="align_center"><i>N</i> = 10</td><td class="align_center">9914.88</td><td class="align_center">599.65</td><td class="align_center">649.29</td></tr><tr><td class="align_center"><i>N</i> = 20</td><td class="align_center">9922.02</td><td class="align_center">9914.60</td><td class="align_center">1590.03</td></tr><tr><td class="align_center"><i>N</i> = 30</td><td class="align_center">9912.36</td><td class="align_center">9910.96</td><td class="align_center">5203.65</td></tr><tr><td class="align_left" colspan="5"><hr/></td></tr><tr><td class="align_left" rowspan="3"><i>N</i> = 20</td><td class="align_center"><i>K</i> = 10</td><td class="align_center">9922.02</td><td class="align_center">9914.02</td><td class="align_center">1590.03</td></tr><tr><td class="align_center"><i>K</i> = 20</td><td class="align_center">9922.02</td><td class="align_center">9912.13</td><td class="align_center">1901.18</td></tr><tr><td class="align_center"><i>K</i> = 30</td><td class="align_center">9922.02</td><td class="align_center">1857.49</td><td class="align_center">1784.71</td></tr><tr class="table-tr"><td colspan="5"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Cumulative regret of each algorithm in 10,000 episodes.</div>

Computational Intelligence and Neuroscience

tab3

Table 3

Table 3: IoT-Based Reinforcement Learning Using Probabilistic Model for Determining Extensive Exploration through Computational Intelligence for Next-Generation Techniques 

Table 3 | IoT-Based Reinforcement Learning Using Probabilistic Model for Determining Extensive Exploration through Computational Intelligence for Next-Generation Techniques