我是python的新手,并设法编写了一个小程序(使用python3)从网站检索信息。我有两个问题:


我不知道如何告诉python等待第80个步骤,所以当i = 80、160、240等时。
我不知道如何告诉python从网站检索信息,总共存在多少步骤(因为每个页面的不同),请参见下图。我可以在图片中看到,在此示例中,最大数量为260是“硬编码”的吗?我可以告诉python自己检索260(如果在另一个网页上更改,则可以检索其他数字)?
我如何告诉python检查脚本从哪个当前页面开始,以便它可以将i调整为页面的编号?通常,我假设从第0页开始(i = 0),但是例如,如果要从第30页开始,我的脚本应该可以使i = 30,或者如果我从200开始,则应该可以调整在进入while循环之前,i = 200等。


我不清楚要处理什么吗?

python - python3和selenium的迭代和检索信息问题-LMLPHP

这是伪代码:

import time
from selenium import webdriver

url = input('Please, enter url: ')

driver = webdriver.Firefox()
driver.get(url)

i = 0

while i > 260: # how to determine (book 1 = 260 / book 2 = 500)?
    # do something
    if i == 80: # each 80th page?
        # pause
    else:
    # do something else
    i = i + 1
else:
    quit()

最佳答案

1)睡觉

import time
....
    if i % 80 == 0: # each 80th page?
        # Wait for 5 seconds
        time.sleep(5)


2)element selectors

html = driver.find_element_by_css_selector('afterInput').get_attribute('innerHTML')


3)论点

import sys
....
currentPage = sys.argv[2]


或从源中提取(请参阅2)

关于python - python3和selenium的迭代和检索信息问题,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43556335/

10-14 12:15
查看更多