我正在使用FAST For SharePoint来爬网非SharepPoint网站。该网站没有任何错误,我可以得到任何关键字的结果。

我想通过html页面元标记在结果页面上创建优化程序。必须有两个级别的优化程序;类别和子类别。如果用户单击类别,那么“精简程序”面板必须显示所有相关的子类别。

像这样的元标记:

<meta name="Category" content="Products"/>
<meta name="SubCategory" content="Electronic"/>


如何使用FAST For SharePoint Webcrawler提取对html页面进行爬网的元标记?

我试图将元标记名称添加到FAST Search管理>托管属性中,并为这些元标记配置了优化器面板,但无法获得结果。这是行不通的。

谢谢!

最佳答案

如果要使用自定义托管属性,则需要首先将它们绑定到已爬网属性。爬网属性是在爬网期间自动创建的,或者您可以在powershell中创建它们,请参见以下链接:http://msdn.microsoft.com/en-us/subscriptions/ff393776(v=office.14).aspx

据我了解,您正在尝试获取页面HTML中的信息。在这种情况下,您将无法使用现成的Web搜寻器来获取此信息。如果要创建自定义搜寻器以获取所需信息,建议您查看自定义BDC连接器:http://msdn.microsoft.com/en-us/library/ee557349(v=office.14).aspx

关于sharepoint-2010 - 快速进行SharePoint Web爬网程序元标记提取,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6779185/

10-13 06:50