Optimizing the Pairs-Trading Strategy Using Deep Reinforcement Learning with Trading and Stop-Loss Boundaries

<table class="fixed-width table-group" id="tab7"><tr><td><table class="table"><colgroup><col style="width:4.70em"/><col style="width:4.59em"/><col style="width:6.17em"/><col style="width:3.91em"/><col style="width:7.41em"/><col style="width:7.41em"/><col style="width:7.41em"/><col style="width:6.29em"/></colgroup><tr><td class="thead-hr" colspan="8"><hr/></td></tr><tr class="thead"><td class="align_left">Model</td><td class="align_center">MDD</td><td class="align_center">Sharpe ratio</td><td class="align_center">Profit</td><td class="align_center"># of open portfolios</td><td class="align_center"># of closed portfolios</td><td class="align_center"># of stop-loss portfolios</td><td class="align_center"># of exited portfolios</td></tr><tr><td class="thead-hr" colspan="8"><hr/></td></tr><tr><td class="align_left">PTDQN</td><td class="align_center">−0.0944</td><td class="align_center">0.2133</td><td class="align_center">4.8760</td><td class="align_center">541</td><td class="align_center">399</td><td class="align_center">104</td><td class="align_center">63</td></tr><tr><td class="align_left">PTA0</td><td class="align_center">−0.1210</td><td class="align_center">0.1522</td><td class="align_center">4.1948</td><td class="align_center">579</td><td class="align_center">413</td><td class="align_center">125</td><td class="align_center">41</td></tr><tr><td class="align_left">PTA1</td><td class="align_center">−0.1015</td><td class="align_center">0.1650</td><td class="align_center">3.8834</td><td class="align_center">430</td><td class="align_center">310</td><td class="align_center">50</td><td class="align_center">70</td></tr><tr><td class="align_left">PTA2</td><td class="align_center">−0.1483</td><td class="align_center">0.1722</td><td class="align_center">3.3425</td><td class="align_center">320</td><td class="align_center">209</td><td class="align_center">13</td><td class="align_center">98</td></tr><tr><td class="align_left">PTA3</td><td class="align_center">−0.1386</td><td class="align_center">0.1771</td><td class="align_center">2.4385</td><td class="align_center">217</td><td class="align_center">101</td><td class="align_center">3</td><td class="align_center">113</td></tr><tr><td class="align_left">PTA4</td><td class="align_center">−0.1749</td><td class="align_center">0.1602</td><td class="align_center">1.6852</td><td class="align_center">119</td><td class="align_center">38</td><td class="align_center">2</td><td class="align_center">79</td></tr><tr><td class="align_left">PTA5</td><td class="align_center">−0.2862</td><td class="align_center">0.0137</td><td class="align_center">1.0362</td><td class="align_center">55</td><td class="align_center">10</td><td class="align_center">0</td><td class="align_center">45</td></tr><tr class="table-tr"><td colspan="8"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Average top-5 performance results for XOM and CVX using TLS within the training period.</div>

Complexity

tab7

Table 7

Table 7: Optimizing the Pairs-Trading Strategy Using Deep Reinforcement Learning with Trading and Stop-Loss Boundaries