我的大学托管着一个小网站。该政策是未启用服务器端脚本语言(例如PHP等),因此网站是静态的或可以使用客户端脚本(例如javascript等)。我也无法触摸服务器/对其进行配置/安装。
无论如何,我想从其他网站(即Google Scholar引用)中添加一些数据,这些数据我可以使用Python + lxml动态地进行抓取。
有什么办法可以动态查询这些数据-当然是在客户端?
我尝试使用IronPython将我的Python代码嵌入到我的网页中,但是它抱怨无法找到lxml导入的库。但是类似的解决方案将是很好的。
还是纯JavaScript的库,它允许打开和解析外部网页...?
谢谢!
最佳答案
否。same origin policy阻止它。
使用第三方代理将数据转码为JSON-P,或者使用其他主机。
或者,在您控制的服务器上运行一个cron作业,该作业会定期生成新的静态HTML并上传到您的主机。