我熟悉如何使用Google Chrome Web Inspector手动将网页另存为具有内容的HAR文件。我想使它自动化。

在搜索用于自动生成HAR文件的工具时,我找到了一些解决方案,但是没有一个解决方案可以节省资源的内容。

我已经尝试了以下方法,但没有任何运气:

  • https://github.com/ariya/phantomjs/blob/master/examples/netsniff.js
  • https://github.com/cyrus-and/chrome-har-capturer

  • 获取您请求的页面的内容(原始HTML)是可行的,但是获取所有其他正在加载的网络资源(CSS,javascript,图像等)的内容是我的问题。

    最佳答案

    我认为自动生成HAR的最可靠方法是使用BrowsermobProxy以及chromedriver和Selenium。

    这是python中的脚本,用于以编程方式生成可以集成到您的开发周期中的HAR文件。它还捕获内容。

    from browsermobproxy import Server
    from selenium import webdriver
    import os
    import json
    import urlparse
    
    server = Server("path/to/browsermob-proxy")
    server.start()
    proxy = server.create_proxy()
    
    chromedriver = "path/to/chromedriver"
    os.environ["webdriver.chrome.driver"] = chromedriver
    url = urlparse.urlparse (proxy.proxy).path
    chrome_options = webdriver.ChromeOptions()
    chrome_options.add_argument("--proxy-server={0}".format(url))
    driver = webdriver.Chrome(chromedriver,chrome_options =chrome_options)
    proxy.new_har("http://stackoverflow.com", options={'captureHeaders': True,'captureContent':True})
    driver.get("http://stackoverflow.com")
    result = json.dumps(proxy.har, ensure_ascii=False)
    print result
    proxy.stop()
    driver.quit()
    

    您还可以 check out 此工具,该工具可以从Chrome和Firefox轻松生成HAR和NavigationTiming数据:Speedprofile

    07-28 10:28