selenium + chrome
很多难以采集的网站都使用selenium爬取,但是后来发现selenium
有特征值,会被检测出来,今天来小结一下反反爬方案
测试网站 全绿好像代表没被检测出
中间人修改js
网上很多都是这种博客,不知道靠不靠谱
pyppeteer
这种python的异步请求库,似乎极好的解决了
简书博客
开发者模式
似乎使用开发者模式可以避免被检测,还需要测试,拼夕夕貌似给绕过去了hhh
[python+selenium代码]
options = webdriver.ChromeOptions()
options.add_experimental_option('excludeSwitches', ['enable-automation'])
driver = webdriver.Chrome(options=option)