就像标题中所说的那样,我有一个meta标签,我需要抓取一些信息。
Link
我正试图从此站点中提取作者隶属关系。这些信息可以在使用Google开发工具的以下代码行中找到:

document.getElementsByName('citation_author_institution')


然后,我得到了我认为是如下所示的元素或节点的数组:

[<meta name=​"citation_author_institution" content=​"Columbia University, New York">​, <meta name=​"citation_author_institution" content=​"Columbia University, New York">​, <meta name=​"citation_author_institution" content=​"Columbia University, New York">​]


现在,我只需要访问内容并将其保存为数组即可将其放入数据库中。
我已经尝试过类似的东西

document.getElementsByName('citation_author_institution').textContent
document.getElementsByName('citation_author_institution').getAttribute('content')


但这不起作用。有人对我有任何想法或建议吗?

最佳答案

你很亲密您需要做的是遍历节点列表:

    var elements = document.getElementsByName('citation_author_institution')
    var contents = []

    for (var i = 0; i < elements.length; i++) {
        contents.push(elements[i].content);
    }

    console.log(contents)


因此,contents将是您的内容列表。这里的例子
https://jsfiddle.net/o3Lzm4ca/

09-25 18:33
查看更多