Research on Parallel Support Vector Machine Based on Spark Big Data Platform

<table class="table-group" id="tab2"><tr><td><table class="table"><tr><td class="thead-hr" colspan="4"><hr/></td></tr><tr class="thead"><td class="align_left">Number</td><td class="align_center">Node name</td><td class="align_center">Hadoop’s configuration</td><td class="align_center">Spark’s configuration</td></tr><tr><td class="thead-hr" colspan="4"><hr/></td></tr><tr><td class="align_left">1</td><td class="align_center">Master</td><td class="align_center" rowspan="6">dfs.replication = 3; map.tasks.maximum = 16; reduce.tasks.maximum = 2; child.java.opts = -Xmx4096 M</td><td class="align_center" rowspan="6">SPARK_MEM = 20g</td></tr><tr><td class="align_left">2</td><td class="align_center">Slave01</td></tr><tr><td class="align_left">3</td><td class="align_center">Slave02</td></tr><tr><td class="align_left">4</td><td class="align_center">Slave03</td></tr><tr><td class="align_left">5</td><td class="align_center">Slave04</td></tr><tr><td class="align_left">6</td><td class="align_center">Slave05</td></tr><tr class="table-tr"><td colspan="4"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Configuration of test cluster.</div>

Scientific Programming

tab2

Table 2

Table 2: Research on Parallel Support Vector Machine Based on Spark Big Data Platform