我们想要在html主体中设置一个蜜 jar 图像,以检测刮板/不良机器人。

有人以前设置过类似的东西吗?

我们认为最好的方法是:

a)通过以下方式注释掉html:

<!-- <img src="http://www.domain.com/honeypot.gif"/> -->

b)将CSS样式应用于图片,使其通过以下方式对浏览器隐藏:
.... id="honeypot" ....

#honeypot{
    display:none;
    visibility:hidden;
}

使用上述方法,是否有人能预见到适当的真实用户代理会拉动图像/尝试渲染图像的任何情况?

honeypot.gif将是一个mod_rewrite的php脚本,我们将在其中进行日志记录。

虽然我知道上面的2个条件可能会被任何编码良好的刮板跳过,但至少可以让我们对非常脏的刮板有所了解。

还有其他关于实现此目标的最佳方法的指示吗?

最佳答案

漫游器将忽略您的img标签,因为它位于注释中。

取而代之的是,您可以考虑创建一个不可见的div,该div包含指向同一站点上触发器URL的链接(最好是在同一目录中,以防漫游器对深度敏感)。

关于html - 使用honeypot img标签检测刮板/不良机器人的建议,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7340105/

10-11 07:38