Pipelined Training with Stale Weights in Deep Convolutional Neural Networks

<table class="table-group" id="tab9"><tr><td><table class="table"><tr><td class="thead-hr" colspan="8"><hr/></td></tr><tr class="thead"><td class="align_left">CNN</td><td class="align_center">Dataset</td><td class="align_center">PPV</td><td class="align_center">Activation memory for minibatch size 1 (MB)</td><td class="align_center">Minibatch size</td><td class="align_center">Total weight memory (MB)</td><td class="align_center">Memory increase % of PipeDream</td><td class="align_center">Memory increase % of this work</td></tr><tr><td class="thead-hr" colspan="8"><hr/></td></tr><tr><td class="align_left">LeNet-5</td><td class="align_center">MNIST</td><td class="align_center">(2)</td><td class="align_center">0.06</td><td class="align_center">128</td><td class="align_center">0.24</td><td class="align_center">109</td><td class="align_center">97</td></tr><tr><td class="align_left">AlexNet</td><td class="align_center">CIFAR-10</td><td class="align_center">(3)</td><td class="align_center">0.88</td><td class="align_center">128</td><td class="align_center">88.87</td><td class="align_center">214</td><td class="align_center">37</td></tr><tr><td class="align_left">VGG-16</td><td class="align_center">CIFAR-10</td><td class="align_center">(2)</td><td class="align_center">3.30</td><td class="align_center">128</td><td class="align_center">58.16</td><td class="align_center">124</td><td class="align_center">75</td></tr><tr><td class="align_left">ResNet-20</td><td class="align_center">CIFAR-10</td><td class="align_center">(7)</td><td class="align_center">3.84</td><td class="align_center">128</td><td class="align_center">1.03</td><td class="align_center">61</td><td class="align_center">60</td></tr><tr><td class="align_left">VGG-16</td><td class="align_center">ImageNet</td><td class="align_center">(2)</td><td class="align_center">218.59</td><td class="align_center">32</td><td class="align_center">527.79</td><td class="align_center">105</td><td class="align_center">77</td></tr><tr class="table-tr"><td colspan="8"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>LeNet-5, AlexNet, VGG-16, and ResNet-20 memory increase of 4-stage pipelined training.</div>

Applied Computational Intelligence and Soft Computing

tab9

Table 9

Table 9: Pipelined Training with Stale Weights in Deep Convolutional Neural Networks