我是python
的新手,并设法编写了一个小程序(使用python3
)从网站检索信息。我有两个问题:
我不知道如何告诉python
等待第80个步骤,所以当i = 80、160、240等时。
我不知道如何告诉python
从网站检索信息,总共存在多少步骤(因为每个页面的不同),请参见下图。我可以在图片中看到,在此示例中,最大数量为260是“硬编码”的吗?我可以告诉python
自己检索260(如果在另一个网页上更改,则可以检索其他数字)?
我如何告诉python
检查脚本从哪个当前页面开始,以便它可以将i调整为页面的编号?通常,我假设从第0页开始(i = 0),但是例如,如果要从第30页开始,我的脚本应该可以使i = 30,或者如果我从200开始,则应该可以调整在进入while循环之前,i = 200等。
我不清楚要处理什么吗?
这是伪代码:
import time
from selenium import webdriver
url = input('Please, enter url: ')
driver = webdriver.Firefox()
driver.get(url)
i = 0
while i > 260: # how to determine (book 1 = 260 / book 2 = 500)?
# do something
if i == 80: # each 80th page?
# pause
else:
# do something else
i = i + 1
else:
quit()
最佳答案
1)睡觉
import time
....
if i % 80 == 0: # each 80th page?
# Wait for 5 seconds
time.sleep(5)
2)element selectors
html = driver.find_element_by_css_selector('afterInput').get_attribute('innerHTML')
3)论点
import sys
....
currentPage = sys.argv[2]
或从源中提取(请参阅2)
关于python - python3和selenium的迭代和检索信息问题,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43556335/