我正在尝试查询CiteULike中研究论文的书签数量。我正在使用“ http://www.citeulike.org/api/posts/for/doi/” URL,以便提出一个XML文档的请求(使用Python的urllib2库),该请求包含有关给定DOI(纸张的唯一标识符)的书签信息。但是,我不断收到HTTP 403错误:Forbbiden。

有人知道我为什么收到此错误吗?我尝试将URL和DOI放在浏览器中,并且返回XML很好,所以问题似乎与我的自动请求有关。

谢谢,
拿他尼尔

最佳答案

您应该阅读http://wiki.citeulike.org/index.php/Importing_and_Exporting#Scripting_CiteULike


  如果您通过自动化流程访问CiteULike,则必须提供
  表示通过User-Agent字符串标识自己。请用
  “ / ”,例如“ fred/[email protected]
  myscraper / 1.0“。该网站的任何脚本都无法识别
  您可能会导致封锁。

08-28 23:05