我的url结构设置为两个并行(都指向同一个位置):
www.example.com/subname
www.example.com/123
问题是,蜘蛛爬进了像这样的东西:
www.example.com/subname/default_media_function
www.example.com/subname/map_function
请注意,名称“subname”表示我的站点上数千个具有相同功能的不同页面。
它们之所以会抛出错误,是因为这些链接严格用于json或ajax目的,而不是实际的链接。我想阻止他们访问这些页面,但如果url包含变量,我该怎么做呢?
这在robots.txt中有效吗?

Disallow: /map_function

最佳答案

你必须这么做

Disallow: /subname/map_function

robots将在根级别查找robots.txt。在那里,他们评估的网址从左到右没有通配符。
因此,您需要为所有map_函数创建一个位置并排除该位置,或者排除所有位置。

关于seo - 在robots.txt中指定变量,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/3238308/

10-13 00:30