A Multimodal Information Fusion Model for Robot Action Recognition with Time Series

<table class="table-group" id="tab1"><tr><td><table class="table"><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr class="thead"><td class="align_left">Parameters</td><td class="align_center">Value</td></tr><tr><td class="thead-hr" colspan="2"><hr/></td></tr><tr><td class="align_left">Number of clips <i>D</i></td><td class="align_center">30</td></tr><tr><td class="align_left">Image frame size</td><td class="align_center">280 ∗ 280</td></tr><tr><td class="align_left">Convolutional layer</td><td class="align_center">5</td></tr><tr><td class="align_left">Pooling layer</td><td class="align_center">3</td></tr><tr><td class="align_left">Inception module</td><td class="align_center">3</td></tr><tr><td class="align_left">Hidden layer dimension</td><td class="align_center">2048</td></tr><tr><td class="align_left">Dropout</td><td class="align_center">0.3</td></tr><tr><td class="align_left">Initial learning rate</td><td class="align_center">0.001</td></tr><tr><td class="align_left">Batch size</td><td class="align_center">32</td></tr><tr><td class="align_left">Weight decay factor</td><td class="align_center">0.00001</td></tr><tr class="table-tr"><td colspan="2"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Experimental parameter settings.</div>

Journal of Electrical and Computer Engineering

tab1

Table 1

Table 1: A Multimodal Information Fusion Model for Robot Action Recognition with Time Series