一、selenium的三种等待
当执行python的selenium代码时,如果需要定位一个元素或者点击一个元素,需要考虑到网速等多方面原因,导致页面加载速度慢,元素还未加载出来,这样就会导致找不到对应元素,从而报错的问题,所以要设置等待条件,等待元素加载出来后才执行相应的代码。
其中,selenium中有三种等待方式,下面一一进行介绍。
1、强制等待
最简单的一种方式,直接引入time模块,设置等待时间,但这种方式实用性不高,设置时间太短元素仍未找到,设置时间过长影响效率。
import time time.sleep(5)
2、显式等待
原理:指定一个等待条件,和一个最长等待时间,程序会判断在等待时间内条件是否满足,如果满足则返回,如果不满足会继续等待,超过时间就会抛出异常。
(简而言之,就是直到元素出现才去操作,如果超时则报异常)from selenium.webdriver import Chromefrom selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as EC browser = Chrome() # 浏览器对象 browser.get('http://www.baidu.com') # 访问百度页面 e = browser.find_element_by_id('kw') # 发送数据,输入文本 e.send_keys('柠檬班') # 快速点击,查找父节点如果有form表单就会直接提交 e.submit() wait = WebDriverWait(browser, 20) e = wait.until(EC.visibility_of_element_located((By.XPATH, "//a[contains(text(), 'lemon.ke.qq.com/' )]"))) e = browser.find_element_by_xpath("//a[contains(text(), 'lemon.ke.qq.com/' )]") print(e)WebDriverWait(driver,timeout,poll_frequency
=
0.5
,ignored_exceptions
=
None
)
driver:浏览器驱动
timeout:最长超过时间,默认以秒为单位
poll_frequency:监测的时间间隔,默认为
0.5
秒
ignored_exceptions:超时后的异常信息,默认情况下抛NoSuchElementException异常
WebDriverWait一般有until和until_not方法配合使用
until(method,message)
until_not(method ,message)
until中的所有方法:
title_is 标题是某内容
title_contains 标题包含某内容
presence_of_element_located 元素加载出,传入定位元组,如(By.ID, 'p')
visibility_of_element_located 元素可见,传入定位元组
visibility_of 可见,传入元素对象
presence_of_all_elements_located 所有元素加载出
text_to_be_present_in_element 某个元素文本包含某文字
text_to_be_present_in_element_value 某个元素值包含某文字
frame_to_be_available_and_switch_to_it frame加载并切换
invisibility_of_element_located 元素不可见
element_to_be_clickable 元素可点击
staleness_of 判断一个元素是否仍在DOM,可判断页面是否已经刷新
element_to_be_selected 元素可选择,传元素对象
element_located_to_be_selected 元素可选择,传入定位元组
element_selection_state_to_be 传入元素对象以及状态,相等返回True,否则返回False
element_located_selection_state_to_be 传入定位元组以及状态,相等返回True,否则返回False
alert_is_present 是否出现Alert
3、隐式等待
原理:隐式等待,就是在创建driver时,为浏览器对象创建一个等待时间,这个方法是得不到某个元素就等待一段时间,直到拿到某个元素位置。
当使用了隐式等待执行测试的时候,如果 WebDriver没有在 DOM中找到元素,将继续等待,超出设定时间后则抛出找不到元素的异常,换句话说,当查找元素或元素并没有立即出现的时候,隐式等待将等待一段时间再查找 DOM,默认的时间是0。
缺点:局限性高,只能用来等元素出现,或者是某个指令没有完成,并不能等待所有情况,只能等待很少的一部分。
from selenium.webdriver import Chrome browser = Chrome() # 浏览器对象 # 开启隐式等待,全局只需放一次 browser.implicitly_wait(30) browser.implicitly_wait(10) # 等待十秒加载不出来就会抛出异常,10秒内加载出来正常返回 browser.get('http://www.baidu.com') e = browser.find_element_by_id('kw') print(e)
implicity_wait()默认参数的单位为秒,本例中设置等待时长为10秒,首先这10秒并非一个固定的等待时间,它并不影响脚本的执行速度。其次,它并不针对页面上的某一元素进行等待。当脚本执行到某个元素定位时,如果元素可以定位,则继续执行,如果元素定位不到,则它将以轮询的方式不断地判断元素是否被定位到。假设在第六秒定位到了元素则继续执行,若直到超出设置的时长10秒还没有定位到元素,则抛出异常。
二、selenium的三种切换
1、窗口切换
原理:获取打开新窗口之前的句柄(列表),然后在获取打开新窗口之后的句柄,使用browser.switch_to.window(handles[-1])方法切换到最新窗口。
from selenium.webdriver import Chrome from selenium.webdriver.support.wait import WebDriverWait from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as EC browser = Chrome() # 浏览器对象 # 开启隐式等待,全局只需放一次 browser.implicitly_wait(30) # 30S之内只要元素出现就结束,每一个元素都有30S browser.get('http://www.baidu.com') e = browser.find_element_by_id('kw') # 类型e WebElement # 发送数据,输入文本 e.send_keys('柠檬班') # 快速点击,查找父节点如果有form表单就会直接提交 e.submit() # 定定位百度一下 # e_submit = browser.find_element_by_id('su') # e_submit.click() # time.sleep(10) # 定时器 wait = WebDriverWait(browser, 20) e = wait.until(EC.visibility_of_element_located((By.XPATH, "//a[contains(text(), 'lemon.ke.qq.com/' )]"))) e = browser.find_element_by_xpath("//a[contains(text(), 'lemon.ke.qq.com/' )]") handles = browser.window_handles # 是一个列表 获取句柄的动作一定要放到click之前,因为new_window_is_opened是要比较句柄数量 e.click() print(browser.window_handles) # 切换窗口,可能窗口没打开,也是需要等待的,必须要用显示等待 # 定时器 wait = WebDriverWait(browser, 20) e = wait.until(EC.new_window_is_opened(handles))
browser.switch_to.window(handles[-1])
wait = WebDriverWait(browser, 20)
e = wait.until(EC.visibility_of_element_located((By.XPATH, "//h4[text()='华华老师']")))
# 找到华华 huahua = browser.find_element_by_xpath("//h4[text()= '华华老师' ]")
print(huahua)
注意:获取句柄的动作一定要放到click之前,因为new_window_is_opened是要比较句柄数量。
2、iframe切换
from selenium.webdriver import Chrome from selenium.webdriver.support.wait import WebDriverWait from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as EC browser = Chrome() # 浏览器对象 # 开启隐式等待,全局只需放一次 browser.implicitly_wait(30) # 30S之内只要元素出现就结束,每一个元素都有30S browser.get('http://www.baidu.com') # iframe 等待 wait = WebDriverWait(browser, 20) e = wait.until(EC.frame_to_be_available_and_switch_to_it((By.XPATH, '//iframe[@name="iframe2"]'))) # 会自动进行切换,不用再单独进行切换 # browser.switch_to.frame('iframe2') e = browser.find_element_by_id('kw') print(e) """ :Usage: driver.switch_to.frame('frame_name') driver.switch_to.frame(1) 索引 driver.switch_to.frame(driver.find_elements_by_tag_name("iframe")[0]) webelement对象切换 """ iframe_e = browser.find_element_by_xpath('//iframe[@name="iframe2"]') browser.switch_to.frame(iframe_e)