Selenium 体系中用来操作浏览器的 API 就是 WebDriver,WebDriver 针对多种语言都实现了一套 API,支持多种编程语言。

Selenium 通常用来做自动化测试,或者编写网络爬虫。

通常我们说的 Selenium 自动化操作,指的就是 WebDriver 中提供的控制方法。一般我们讲 Selenium 多半都是在谈 WebDriver。

Webdirver 中提供了对浏览器、网页元素、鼠标键盘等操作方法:

  • 浏览器操作: 打开和关闭浏览器、改变浏览器分辨率,切换窗口,模拟刷新等
  • 页面元素定位: WebDriver 中提供了 Id、Name、Link text、Css、Xpath 等定位方式,用于查找需要操作的网页元素
  • 页面元素操作: 找到元素都,就可以对元素进行操作。比如点击click、输入send_keys、清空文本clear、获取文本text、获取属性get_attribute
  • 其他方法: 页面等待、frame 切换、调用JS、模拟鼠标键盘等

启动浏览器

对于 WebDriver 的控制方法,先从对浏览器的基本控制说起。要操作网页元素,首先需要启动浏览器,下面的代码就实现启动浏览器,并打开百度首页:

# 引入webdriver
from selenium import webdriver
# 启动 chrome 浏览器
driver = webdriver.Chrome(executable_path='driver/chromedriver.exe')
# 打开百度首页
driver.get("https://www.baidu.com") 

浏览器控制

控制浏览器大小

通过 WebDriver 打开浏览器一般默认都是窗口状态(非全屏),这可能会导致某些网页显示不全,无法定位和操作某些页面元素。

可以通过 WebDriver 控制浏览器的大小:

driver.maximize_window()    # 浏览器最大化
driver.set_window_size(480, 800)    # 设置浏览器480,800为像素大小
driver.minimize_window()    # 浏览器最小化

一般,用 maximize_window() 方法最大化即可。

后退、前进

在使用浏览器的过程中,为了方便在浏览过的网页之间切换,WebDriver 也提供了对应的 back() 和 forword() 方法来模拟后退和前进按钮。

driver.back()            # 后退到上一个页面
driver.forward()         # 前进到下一个页面

如无特殊需要,不建议使用这两个方法。

浏览器刷新

有时候需要手动刷新(F5)页面,例如页面上有些统计字段,当数据发生改变时,并不会及时变化,需要刷新页面后才会变化。此时可以使用模拟浏览器刷新的方法 refresh()。

driver.refresh()         # 浏览器刷新,与F5同理

退出

WebDriver 提供了两种退出方式:close() 和 quit(),close() 方法只关闭当前窗口,quit() 则完全退出(删除 session,并关闭浏览器驱动)。

driver.close()           # 关闭当前窗口,不会关闭浏览器驱动
driver.quit()            # 退出所有窗口并关闭浏览器驱动
01-25 12:46