This site 在“Power and Energy”文本旁边有一个“export as csv”按钮。该按钮的 This is the link 可以在浏览器的开发者工具中找到(请注意,链接每 15 分钟更改一次)
我的问题是,有没有办法在不打开浏览器的情况下使用 python 获取该链接? (即不使用 Selenium ,因为如果我为多个站点这样做需要时间。)
我的目标是每 1 小时自动执行一次下载该 CSV 文件的过程。
最佳答案
该网址在 curl 中有效。因此,数据不依赖于 javascript,您也不需要 selenuim。 st 和 et 是 unix 时间:
datetime.datetime.utcfromtimestamp(1567296000000/1000)
timeUnit=4 是每天的,因此每小时发出请求会浪费站点和您的资源。如果您确实需要每小时,请更改 timeUnit=3 和 pn0=Power。能量 = 功率 x 小时
最后,我假设由于您计划每小时运行一次,因此您计划将数据保存在某处。如果是这样,请考虑将 st 和 et 调整为仅需要进一步减小请求大小的范围。
关于python - 如何在不打开浏览器的情况下从网页获取动态 HTML 代码?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57748585/