强化学习算法 | 码农家园

引言

在强化学习基础文章中我们提到动态规划方法。动态规划作为一种model-based的方法，使用场景具有非常的局限性。本文将从实际应用角度出发，介绍并对比几种model-free的方法。

算法包括：