就像标题中所说的那样,我有一个meta标签,我需要抓取一些信息。
Link
我正试图从此站点中提取作者隶属关系。这些信息可以在使用Google开发工具的以下代码行中找到:
document.getElementsByName('citation_author_institution')
然后,我得到了我认为是如下所示的元素或节点的数组:
[<meta name="citation_author_institution" content="Columbia University, New York">, <meta name="citation_author_institution" content="Columbia University, New York">, <meta name="citation_author_institution" content="Columbia University, New York">]
现在,我只需要访问内容并将其保存为数组即可将其放入数据库中。
我已经尝试过类似的东西
document.getElementsByName('citation_author_institution').textContent
document.getElementsByName('citation_author_institution').getAttribute('content')
但这不起作用。有人对我有任何想法或建议吗?
最佳答案
你很亲密您需要做的是遍历节点列表:
var elements = document.getElementsByName('citation_author_institution')
var contents = []
for (var i = 0; i < elements.length; i++) {
contents.push(elements[i].content);
}
console.log(contents)
因此,
contents
将是您的内容列表。这里的例子https://jsfiddle.net/o3Lzm4ca/