SharePoint 2010 搜索中的爬网程序影响规则和爬网规则之间有什么区别?

最佳答案

爬网程序影响规则定义了 Windows SharePoint Services 帮助搜索服务在爬网期间从网站请求文档的速率。该速率可以定义为同时请求的文档数或请求之间的延迟。在没有爬虫影响规则的情况下,请求的文档数量为 5 到 16,具体取决于硬件资源。

您可以使用爬网程序影响规则来修改在您爬网时放置在网站上的负载。

当您想要从特定路径爬取内容时,爬网规则使您能够设置企业搜索索引引擎的行为。通过使用这些规则,您可以:

  • 防止特定路径内的内容被抓取。

  • 例如,在内容源指向 URL 路径(如 http://www.microsoft.com/ )的场景中,但您希望阻止“下载”子目录 http://www.microsoft.com/downloads/ 中的内容被抓取,您可以为 URL 设置规则,行为如下设置为从该子目录中排除内容。
  • 指示应该爬行否则将从爬网中排除的特定路径。

  • 使用前面的场景,如果下载目录包含一个名为“content”的目录,该目录应该包含在爬网中,您将为以下 URL 创建爬网规则,并将行为设置为包含“content”子目录 http://www.microsoft.com/downloads/content

    关于sharepoint - SharePoint 2010 搜索中的爬网程序影响规则和爬网规则之间有什么区别?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/4980867/

    10-08 22:28