Big Data: Survey, Technologies, Opportunities, and Challenges

<table class="table-group" id="tab4"><tr><td><table class="table"><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr class="thead"><td align="left">Steps</td><td align="left">Tasks </td></tr><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr><td align="left">(1) Input </td><td align="left">(i) Data are loaded into HDFS in blocks and distributed to data nodes <br/>(ii) Blocks are replicated in case of failures <br/>(iii) The name node tracks the blocks and data nodes</td></tr><tr><td align="center" colspan="2"><hr/></td></tr><tr><td align="left">(2) Job </td><td align="left">Submits the job and its details to the Job Tracker</td></tr><tr><td align="center" colspan="2"><hr/></td></tr><tr><td align="left">(3) Job initialization</td><td align="left">(i) The Job Tracker interacts with the Task Tracker on each data node<br/>(ii) All tasks are scheduled</td></tr><tr><td align="center" colspan="2"><hr/></td></tr><tr><td align="left">(4) Mapping </td><td align="left">(i) The Mapper processes the data blocks<br/>(ii) Key value pairs are listed</td></tr><tr><td align="center" colspan="2"><hr/></td></tr><tr><td align="left">(5) Sorting </td><td align="left">The Mapper sorts the list of key value pairs</td></tr><tr><td align="center" colspan="2"><hr/></td></tr><tr><td align="left">(6) Shuffling </td><td align="left">(i) The mapped output is transferred to the Reducers<br/>(ii) Values are rearranged in a sorted format</td></tr><tr><td align="center" colspan="2"><hr/></td></tr><tr><td align="left">(7) Reduction </td><td align="left">Reducers merge the list of key value pairs to generate the final result</td></tr><tr><td align="center" colspan="2"><hr/></td></tr><tr><td align="left">(8) Result</td><td align="left">(i) Values are stored in HDFS<br/>(ii) Results are replicated according to the configuration<br/>(iii) Clients read the results from the HDFS</td></tr><tr class="table-tr"><td colspan="2"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

The Scientific World Journal

tab4

Table 4

Table 4: Big Data: Survey, Technologies, Opportunities, and Challenges