我正在尝试使用 Xpath 从网页中提取元描述,使用 Google 表格。
我有这个工作来拉入标题:=importXml(www.example.com; "//title")
以下是我的两个学习来源:
http://seogadget.co.uk/playing-around-with-importxml-in-google-spreadsheets/
http://docs.google.com/support/bin/answer.py?hl=en&answer=75507
我在这个网站上阅读了许多其他帖子,这似乎是我想要的类似想法:
"/html/head/meta[@name='description']/@content"
"/*/head/meta[@name='description']/@content"
"//head/meta[@name=\"description\"]/@content"
这些在 Google Sheets 中都不起作用,它指定在 Xpath 中编写它。唯一的区别是,在 Google 表格中,您将使用 ' 代替 "(因此描述是这样的)。老实说,我已经尝试了大约 219 种不同的方法......没有运气。
有任何想法吗?提前致谢!
最佳答案
//meta[@name='description']/@content
所以你在谷歌表中的完整 URL 调用将是
=importxml(A1,"//meta[@name='description']/@content")
我已经使用 importXML 构建了一些很棒的 SEO 工具 - 这只是它的开始! :)
关于用于提取元描述的 =importXML() 中的 xpath,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6052472/