介绍

本章介绍了强化学习的基本概念。这些概念在本书中被广泛使用。我们首先通过网格世界介绍这些概念,然后在马尔可夫决策过程的框架下对它们进行更加具体介绍。

\(1.1\): 本章在全书中的位置。