A Coarse-Grained Reconfigurable Architecture with Compilation for High Performance

<table class="table-group" id="tab3"><tr><td><table class="table"><tr><td class="thead-hr" colspan="12"><hr/></td></tr><tr class="thead"><td align="left" rowspan="3"></td><td align="left" colspan="5">Bypassing register usage profile: per PE per cycle</td><td align="center" colspan="6">Performance impact</td></tr><tr class="thead"><td align="center" colspan="2">Average</td><td align="center" colspan="2">Peak</td><td align="center">% Nontransient</td><td align="center" colspan="3">Amount of inter-PE links</td><td align="center" colspan="4">IPC</td></tr><tr class="thead"><td align="center">Disable</td><td align="center">Enable</td><td align="center">Disable</td><td align="center">Enable</td><td align="center">Enable</td><td align="center">Disable</td><td align="center">Enable</td><td align="center">Delta</td><td align="center">Disable</td><td align="center">Enable</td><td align="center">Delta</td></tr><tr><td class="thead-hr" colspan="12"><hr/></td></tr><tr><td align="left">idct(row+col)</td><td align="center">2.8</td><td align="center">2.3</td><td align="center">19</td><td align="center">20</td><td align="center">45%</td><td align="center">2357</td><td align="center">2245</td><td align="center">−5%</td><td align="center">10.9</td><td align="center">11.1</td><td align="center">2%</td></tr><tr><td align="left">interpolate<svg height="11.125" id="M116" style="vertical-align:-0.1638pt" version="1.1" viewbox="0 0 33.974998 11.125" width="33.974998" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink">
<g transform="matrix(.017,-0,0,-.017,.062,10.862)"><use xlink:href="#x38"></use></g><g transform="matrix(.017,-0,0,-.017,11.996,10.862)"><use xlink:href="#xD7"></use></g><g transform="matrix(.017,-0,0,-.017,25.748,10.862)"><use xlink:href="#x38"></use></g>
</svg>_avg4_c</td><td align="center">4.8</td><td align="center">3.1</td><td align="center">21</td><td align="center">14</td><td align="center">58%</td><td align="center">1707</td><td align="center">1333</td><td align="center">−22%</td><td align="center">6.4</td><td align="center">8.8</td><td align="center">38%</td></tr><tr><td align="left">interpolate<svg height="11.125" id="M117" style="vertical-align:-0.1638pt" version="1.1" viewbox="0 0 33.974998 11.125" width="33.974998" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink">
<g transform="matrix(.017,-0,0,-.017,.062,10.862)"><use xlink:href="#x38"></use></g><g transform="matrix(.017,-0,0,-.017,11.996,10.862)"><use xlink:href="#xD7"></use></g><g transform="matrix(.017,-0,0,-.017,25.748,10.862)"><use xlink:href="#x38"></use></g>
</svg>_halfpel_<svg height="12.4375" id="M118" style="vertical-align:-0.1638pt" version="1.1" viewbox="0 0 17.049999 12.4375" width="17.049999" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink">
<g transform="matrix(.017,-0,0,-.017,.062,12.162)"><use xlink:href="#x210E"></use></g><g transform="matrix(.017,-0,0,-.017,8.834,12.162)"><use xlink:href="#x1D463"></use></g>
</svg>_c</td><td align="center">3.7</td><td align="center">3.9</td><td align="center">19</td><td align="center">16</td><td align="center">45%</td><td align="center">1835</td><td align="center">1621</td><td align="center">−12%</td><td align="center">8.3</td><td align="center">9.6</td><td align="center">16%</td></tr><tr><td align="left">sad16_c(<svg height="11.225" id="M119" style="vertical-align:-0.1638pt" version="1.1" viewbox="0 0 50.299999 11.225" width="50.299999" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink">
<g transform="matrix(.017,-0,0,-.017,.062,10.963)"><use xlink:href="#x31"></use></g><g transform="matrix(.017,-0,0,-.017,8.222,10.963)"><use xlink:href="#x36"></use></g><g transform="matrix(.017,-0,0,-.017,20.155,10.963)"><use xlink:href="#xD7"></use></g><g transform="matrix(.017,-0,0,-.017,33.907,10.963)"><use xlink:href="#x31"></use></g><g transform="matrix(.017,-0,0,-.017,42.066,10.963)"><use xlink:href="#x36"></use></g>
</svg>)</td><td align="center">1.0</td><td align="center">0.8</td><td align="center">6</td><td align="center">5</td><td align="center">54%</td><td align="center">4752</td><td align="center">4000</td><td align="center">−16%</td><td align="center">9.8</td><td align="center">10.2</td><td align="center">4%</td></tr><tr><td align="left">get_block(horizontal)</td><td align="center">1.0</td><td align="center">0.9</td><td align="center">6</td><td align="center">5</td><td align="center">22%</td><td align="center">455</td><td align="center">438</td><td align="center">−4%</td><td align="center">8.1</td><td align="center">9.0</td><td align="center">10%</td></tr><tr><td align="left">get_block(vertical)</td><td align="center">1.6</td><td align="center">1.0</td><td align="center">8</td><td align="center">5</td><td align="center">52%</td><td align="center">513</td><td align="center">400</td><td align="center">−22%</td><td align="center">5.7</td><td align="center">8.0</td><td align="center">41%</td></tr><tr><td align="left">get_block(V+H)</td><td align="center">4.2</td><td align="center">2.2</td><td align="center">18</td><td align="center">10</td><td align="center">45%</td><td align="center">1469</td><td align="center">1150</td><td align="center">−22%</td><td align="center">7.9</td><td align="center">9.7</td><td align="center">23%</td></tr><tr><td align="left">get_block(H+V)</td><td align="center">3.1</td><td align="center">2.3</td><td align="center">13</td><td align="center">8</td><td align="center">43%</td><td align="center">1455</td><td align="center">1148</td><td align="center">−21%</td><td align="center">8.4</td><td align="center">9.5</td><td align="center">13%</td></tr><tr><td align="left" colspan="12"><hr/></td></tr><tr><td align="left">Average</td><td align="center"></td><td align="center"></td><td align="center"></td><td align="center"></td><td align="center"></td><td align="center"></td><td align="center"></td><td align="center">−15%</td><td align="center"></td><td align="center"></td><td align="center">18%</td></tr><tr class="table-tr"><td colspan="12"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

Bypassing register usage profile and effects of using non-transient copy on a single tile (16 PE) configuration.

International Journal of Reconfigurable Computing

tab3

Table 3

Table 3: A Coarse-Grained Reconfigurable Architecture with Compilation for High Performance