A Distributed Framework for Predictive Analytics Using Big Data and MapReduce Parallel Programming

<table class="algorithm-group"><tr><td><table class="algorithm" id="alg1"><tr><td> </td><td>Function MAP-1 (training dataset)</td></tr><tr><td> </td><td>Begin</td></tr><tr><td> </td><td>   Input: training dataset <i>D</i> with <i>m</i> instances and <i>n</i> attributes</td></tr><tr><td> </td><td>   Partition the dataset <i>D</i> into <i>s</i> partitions as <i>p</i>1, <i>p</i>2, <i>p</i>3….. ps</td></tr><tr><td> </td><td>   Read x_train[], y_train for each partitioned dataset</td></tr><tr><td> </td><td>      Compute intercept and correlation coefficients for each block of instances</td></tr><tr><td> </td><td>      Convert it into (key, value &gt; pair as &lt; Dataset_id, (intercept, coefficients)&gt;</td></tr><tr><td> </td><td>   Output &lt; Dataset_id, &lt;(intercept, coefficients[])&gt;</td></tr><tr><td> </td><td>end</td></tr></table></td></tr></table>

Mathematical Problems in Engineering

alg1

Algorithm 1

Algorithm 1: A Distributed Framework for Predictive Analytics Using Big Data and MapReduce Parallel Programming