我的大学托管着一个小网站。该政策是未启用服务器端脚本语言(例如PHP等),因此网站是静态的或可以使用客户端脚本(例如javascript等)。我也无法触摸服务器/对其进行配置/安装。

无论如何,我想从其他网站(即Google Scholar引用)中添加一些数据,这些数据我可以使用Python + lxml动态地进行抓取。
有什么办法可以动态查询这些数据-当然是在客户端?

我尝试使用IronPython将我的Python代码嵌入到我的网页中,但是它抱怨无法找到lxml导入的库。但是类似的解决方案将是很好的。
还是纯JavaScript的库,它允许打开和解析外部网页...?

谢谢!

最佳答案

否。same origin policy阻止它。

使用第三方代理将数据转码为JSON-P,或者使用其他主机。

或者,在您控制的服务器上运行一个cron作业,该作业会定期生成新的静态HTML并上传到您的主机。

10-07 19:19
查看更多