Deep Reinforcement Learning-Based Trading Strategy for Load Aggregators on Price-Responsive Demand

<table class="table-group" id="tab2"><tr><td><table class="table"><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr class="thead"><td class="align_left">Parameters</td><td class="align_center">Meaning</td><td class="align_center">Value</td></tr><tr><td class="thead-hr" colspan="3"><hr/></td></tr><tr><td class="align_left">TAU</td><td class="align_center">Smoothing coefficient of target network in actor and critic network</td><td class="align_center">0.001</td></tr><tr><td class="align_left"><i>α</i></td><td class="align_center">Actor network and critic network learning rate</td><td class="align_center">0.0005</td></tr><tr><td class="align_left">Batch_size</td><td class="align_center">Number drawn from the experience pool per training</td><td class="align_center">64</td></tr><tr><td class="align_left">Capacity</td><td class="align_center">Size of the experience pool</td><td class="align_center">100000</td></tr><tr><td class="align_left"><i>γ</i></td><td class="align_center">Discount factor</td><td class="align_center">0.99</td></tr><tr class="table-tr"><td colspan="3"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Description of the parameters of the DDPG.</div>

Computational Intelligence and Neuroscience

tab2

Table 2

Table 2: Deep Reinforcement Learning-Based Trading Strategy for Load Aggregators on Price-Responsive Demand