以下问题是我从人工智能类(class)中找到的一个考试练习。

artificial-intelligence - 爬山的适当启发式机制-LMLPHP

“建议使用爬山算法解决这个问题的启发式机制。(S=起点,F=终点/目标)。不允许对角线移动。”

由于很明显曼哈顿距离或欧几里得距离将在 (3,4) 处发送机器人并且不允许回溯,因此该问题的可能解决方案(启发式机制)是什么?

编辑:为了使问题更清楚,我在板上标记了一些曼哈顿距离:

artificial-intelligence - 爬山的适当启发式机制-LMLPHP

很明显,使用曼哈顿距离,机器人的下一步将是 (3,4),因为它的启发值为 2 - HC 将选择它并永远卡住。目标是通过找到合适的启发式算法尝试并且永远不要走那条路。

最佳答案

我认为障碍物很热,然后热量上升。我将一个单元格的净成本设为到 F 的曼哈顿度量距离加上热量惩罚的总和。因此,存在将机器人拉向 F 的吸引力以及迫使其远离障碍物的排斥力。

有两种类型的热惩罚:

1) 触摸障碍物是非常糟糕的。查看给定单元格正下方的行中相邻单元格的 2 或 3 个单元格。为给定单元正下方的每个障碍单元添加 15,为正下方的每个对角邻居添加 10

2) 对于不直接接触说明书的电池——热量更分散。我将其计算为其列和相邻列中单元格下方的障碍块平均数量的 6 倍。

下面显示了所有这些组合的结果,以及从 S 到 F 的路径:

artificial-intelligence - 爬山的适当启发式机制-LMLPHP

一个关键点是平均导致机器人在碰到顶行时向左转而不是向右转的方式。向左的未加热柱使其成为较冷的方向。有趣的是,所有单元格(右上角的两个单元格可能除外)是如何通过这种启发式方法绘制到 F 的。

关于artificial-intelligence - 爬山的适当启发式机制,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/32362912/

10-13 00:03