selenium+chromedriver获取动态网页数据以及模拟鼠标操作后才能获得的数据

  • Post author:
  • Post category:其他


1.下载chromedriver,记住chromedriver和chrome浏览器版本有

对应关系

2.获得动态加载后的界面

模拟鼠标操作

,获得需要点击等特定操作后才能获得的动态加载的数据

3.源码:

from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains



#下载后的chromedriver地址,我这里是windows版本的
CHROME_DRIVER_PATH = 'D:\\Code\imgageRecognition\\site_scrapy\\chromedriver.exe'



#下载动态界面,返回可被beatifulsoup4解析的数据
def get_dynamic_html(site_url):
    print('开始加载',site_url,'动态页面')
    chrome_options = webdriver.ChromeOptions()
    #ban sandbox
    chrome_options.add_argument('--no-sandbox')
    chrome_options.add_argument('--disable-dev-shm-usage')
    #use headless
    #chrome_options.add_argument('--



版权声明:本文为huangmengfeng原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。