1.1-网格世界

\(1.2\)展示了一个智能体(agent)在网格世界中移动的例子,其将会在整本书中被广泛使用。在每个时刻,智能体只能占据一个单元格。白色单元格代表智能体可以进入的区域,蓝色单元格代表目标区域,橙色单元格代表智能体不可以进入的禁区。智能体的任务即为从初始区域出发,最终到达目标区域。

图 1.2: 在全书中使用的现实网格世界例子

如果智能体事先知道网格世界的地图,那么规划一条到达终点的路径其实不难。但现实世界中情况往往会很复杂,智能体很难了解有关环境的任何信息。此时便需要通过与环境交互获取经验,从而找到一个好的策略。因此在本章中,我们将要学习一系列基本概念来描述这样一个过程。


评论