Efficient Parallel Implementation of Matrix Multiplication for Lattice-Based Cryptography on Modern ARM Processor

<table class="fixed-width table-group" id="tab3"><tr><td><table class="table"><colgroup><col style="width:2.72em"/><col style="width:3.04em"/><col style="width:2.72em"/><col style="width:10.00em"/><col style="width:9.46em"/></colgroup><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr class="thead"><td class="align_left" rowspan="2"><b>N</b></td><td class="align_center" rowspan="2"><b>M</b></td><td class="align_center" rowspan="2"><b>L</b></td><td class="align_center"><b>C version [<a href="/journals/scn/2018/7012056/#B9" target="_blank">3</a>] </b></td><td class="align_center" rowspan="2"><b>Proposed (NEON)</b></td></tr><tr class="thead"><td class="align_center"><b>(Auto-Vectorization)</b></td></tr><tr><td class="thead-hr" colspan="5"><hr/></td></tr><tr><td class="align_left">536</td><td class="align_center">1024</td><td class="align_center">256</td><td class="align_center">148.8991</td><td class="align_center">93.91285</td></tr><tr><td class="align_left" colspan="5"><hr/></td></tr><tr><td class="align_left">663</td><td class="align_center">1024</td><td class="align_center">256</td><td class="align_center">171.0976</td><td class="align_center">159.2069</td></tr><tr><td class="align_left" colspan="5"><hr/></td></tr><tr><td class="align_left">816</td><td class="align_center">1024</td><td class="align_center">384</td><td class="align_center">334.7499</td><td class="align_center">224.5633</td></tr><tr><td class="align_left" colspan="5"><hr/></td></tr><tr><td class="align_left">952</td><td class="align_center">1024</td><td class="align_center">384</td><td class="align_center">391.7564</td><td class="align_center">361.7326</td></tr><tr class="table-tr"><td colspan="5"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Matrix multiplication performance (unit: ms).</div>

Security and Communication Networks

tab3

Table 3

Table 3: Efficient Parallel Implementation of Matrix Multiplication for Lattice-Based Cryptography on Modern ARM Processor