Service Migration Policy Optimization considering User Mobility for E-Healthcare Applications

<table class="algorithm-group"><tr><td><table class="algorithm" id="alg1"><tr><td>(1)</td><td> env = Env ()//Environment Initialization: MDP mode state <i>s</i>, action <i>a</i>, and reward <i>r</i></td></tr><tr><td>(2)</td><td> initialize random policy</td></tr><tr><td>(3)</td><td> for (<i>i</i> = 1, <i>i</i> ++ , <i>i</i> &lt; max_iter)</td></tr><tr><td>(4)</td><td>  <i>V</i> = value_evaluate (policy, env, max_step, tol)//evaluate the random policy</td></tr><tr><td>(5)</td><td>  policy = policy_improvement (env, <i>V</i>)//improve the policy</td></tr><tr><td>(6)</td><td>  mean_values.append (np.mean (<i>V</i>))//store mean value of the policy</td></tr><tr><td>(7)</td><td>  run_times.append (time.time ()-st)//store run time</td></tr><tr><td>(8)</td><td>  if last_<i>V</i> is not None and np.sum (<i>np</i>.abs (<i>V</i>-last_<i>V</i>)) &lt; tol:</td></tr><tr><td>(9)</td><td>   break</td></tr><tr><td>(10)</td><td>  last_V = V//the value function update is small enough, it will stop.</td></tr><tr><td colspan="2">   End for</td></tr><tr><td>(11)</td><td>  return <i>V</i>, mean_values, policy, run_times# return state value, mean value, the optimal policy and run time</td></tr></table></td></tr></table>

<div> SMPI (policy, env, max_step = 100, tol = 1e-6).</div>

Journal of Healthcare Engineering

alg1

Algorithm 1

Algorithm 1: Service Migration Policy Optimization considering User Mobility for E-Healthcare Applications