A Dynamic Hidden Forwarding Path Planning Method Based on Improved Q-Learning in SDN Environments

<div>Illustration of policy iteration in reinforcement learning.</div>

Security and Communication Networks

Figure 1: A Dynamic Hidden Forwarding Path Planning Method Based on Improved Q-Learning in SDN Environments