A Distributed Framework for Predictive Analytics Using Big Data and MapReduce Parallel Programming

<table class="algorithm-group"><tr><td><table class="algorithm" id="alg3"><tr><td> </td><td>Function MAP-II (testing dataset)</td></tr><tr><td> </td><td>   Input: testing dataset TD with <i>k</i> instances and <i>n</i> attributes</td></tr><tr><td> </td><td>   Partition the dataset TD into <i>z</i> partitions as <i>p</i>1, <i>p</i>2, <i>p</i>3…..<i>p</i><sub><i>s</i></sub></td></tr><tr><td> </td><td>   Read x_test[], y_test for each partitioned dataset</td></tr><tr><td> </td><td>      Predict y_predict with the MR-MLR model</td></tr><tr><td> </td><td>      Convert it into (key, value &gt; pair as &lt; Dataset_id, (y_predict, y_test)&gt;</td></tr><tr><td> </td><td>   Output &lt; Dataset_id, (y_predict, y_test)&gt;</td></tr><tr><td> </td><td>End</td></tr></table></td></tr></table>

Mathematical Problems in Engineering

alg3

Algorithm 3

Algorithm 3: A Distributed Framework for Predictive Analytics Using Big Data and MapReduce Parallel Programming