Optimizing the Pairs-Trading Strategy Using Deep Reinforcement Learning with Trading and Stop-Loss Boundaries

<table class="fixed-width table-group" id="tab6"><tr><td><table class="table"><colgroup><col style="width:4.70em"/><col style="width:4.54em"/><col style="width:6.17em"/><col style="width:3.95em"/><col style="width:7.41em"/><col style="width:7.41em"/><col style="width:7.41em"/><col style="width:6.29em"/></colgroup><tr><td class="thead-hr" colspan="8"><hr/></td></tr><tr class="thead"><td class="align_left">Model</td><td class="align_center">MDD</td><td class="align_center">Sharpe ratio</td><td class="align_center">Profit</td><td class="align_center"># of open portfolios</td><td class="align_center"># of closed portfolios</td><td class="align_center"># of stop-loss portfolios</td><td class="align_center"># of exited portfolios</td></tr><tr><td class="thead-hr" colspan="8"><hr/></td></tr><tr><td class="align_left">PTDQN</td><td class="align_center">−0.0842</td><td class="align_center">0.1835</td><td class="align_center">3.4068</td><td class="align_center">469</td><td class="align_center">336</td><td class="align_center">64</td><td class="align_center">96</td></tr><tr><td class="align_left">PTA0</td><td class="align_center">−0.2014</td><td class="align_center">0.1452</td><td class="align_center">2.5934</td><td class="align_center">565</td><td class="align_center">382</td><td class="align_center">132</td><td class="align_center">50</td></tr><tr><td class="align_left">PTA1</td><td class="align_center">−0.1431</td><td class="align_center">0.1773</td><td class="align_center">2.7603</td><td class="align_center">409</td><td class="align_center">279</td><td class="align_center">45</td><td class="align_center">84</td></tr><tr><td class="align_left">PTA2</td><td class="align_center">−0.1234</td><td class="align_center">0.1955</td><td class="align_center">2.6307</td><td class="align_center">325</td><td class="align_center">191</td><td class="align_center">16</td><td class="align_center">118</td></tr><tr><td class="align_left">PTA3</td><td class="align_center">−0.2586</td><td class="align_center">0.0861</td><td class="align_center">1.3850</td><td class="align_center">208</td><td class="align_center">86</td><td class="align_center">2</td><td class="align_center">120</td></tr><tr><td class="align_left">PTA4</td><td class="align_center">−0.2591</td><td class="align_center">0.0803</td><td class="align_center">1.1933</td><td class="align_center">124</td><td class="align_center">39</td><td class="align_center">2</td><td class="align_center">83</td></tr><tr><td class="align_left">PTA5</td><td class="align_center">−0.2448</td><td class="align_center">−0.0638</td><td class="align_center">0.8588</td><td class="align_center">47</td><td class="align_center">11</td><td class="align_center">0</td><td class="align_center">36</td></tr><tr class="table-tr"><td colspan="8"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Average top-5 performance results for XOM and CVX using OLS within the training period.</div>

Complexity

tab6

Table 6

Table 6: Optimizing the Pairs-Trading Strategy Using Deep Reinforcement Learning with Trading and Stop-Loss Boundaries