沈无奇 · 更新于 2020-09-21

深入使用 Splash 服务

Scrapy与 Selenium 的结合使用

Selenium 自动化测试工具介绍

今天我们来介绍下 Selenium 自动化测试工具并借助该工具完成一个简单的案例，这个案例和笔者的工作相关，也算挺有意思的。

1. Selenuim 介绍与使用

Selenium 是一个用于 Web 应用程序自动化测试工具，提供一系列的测试函数。这些函数非常灵活，能够完成界面元素定位、窗口跳转、结果比较。Selenium 测试直接运行在浏览器中，就像真正的用户在操作一样。该自动化测试工具具有如下几个鲜明的特点：

支持多种浏览器：IE、Firefox、Safari、Chrome 等主流浏览器都是支持的；
支持多种变成语言：支持主流的编程语言，如 Java、Python、Ruby、PHP 等；
支持多种操作系统：如 Windows、Linux、IOS 以及 Android 等；
开源免费：selenuim 在 github 上进行了开源，star 和 fork 数都彰显了该项目的流行度。Selenium框架由多个工具组成，包括：Selenium IDE，Selenium RC，Selenium WebDriver和SeleniumRC。

我们直接来在使用 Python 操作 Selenuim：

安装 selenium 模块：pip install selenium -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com；

接下来，我们要使用 Google 浏览器完成 selenium 的自动化操作，因此需要安装相应的 webdriver。对应 Google 浏览器的 webdriver 的下载地址为：下载。找到对应的 Chrome driver 版本，下载即可：

图片描述

本地 chrome 版本查看

图片描述

选择 webdriver 版本

下载了 webdriver 包后解压得到 chromedriver.exe，将其放到和 Chrome 浏览器相同的路径下：
图片描述

解压chromedriver包，将exe文件放到chrome的目录下去

接下来将上面的这个路径添加到系统变量 Path 中去，确保能找到 chromedriver.exe 这个文件：
图片描述

添加 chromedriver.exe 所在目录到Path变量中去

接下来，我们完成一段简单的 Selenium 自动化测试代码，帮助我们更好的理解 Selenium 这个工具：

"""
selenium工具测试
"""
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC


driver = webdriver.Chrome()
# 请求百度页面
driver.get("https://www.baidu.com") 

# 找到输入框位置
input = driver.find_element_by_id("kw")
# 输入"慕课网 wiki宝典"
input.send_keys("慕课网 wiki宝典")
# 找到<百度一下>按钮
button = driver.find_element_by_id("su")
# 点击
button.click()

# 直到出现分页元素
element = WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.ID, "page"))
)
# 找到搜索内容的第一条结果
wiki_page = driver.find_element_by_xpath('//div[@id="content_left"]/div[1]/h3/a')
# 点击跳转到慕课网的wiki页面
wiki_page.click()

上面的代码比较简单，我们只需要了解下 selenium 工具提供的基本函数就能够理解，代码中已经做好了相关注释，我们直接来运行看看效果如何：

是不是有点意思？这段代码帮我们自动启动 Chrome 浏览器，跳转到百度页面，然后再输入框中输入 “慕课网 wiki”，然后点击百度一下。在搜索的页面中选择第一个点击，进入到慕课网的 wiki 页面中。这整个过程就是由代码控制完成，没有人为操作，这是不是就是我们想象的自动化测试呢？自信点，就是这样的！

2. 基于 Selenium 完成发票认证

接下来，我们基于 Scrapy 和 Selenium 来完成笔者工作中的一个需求。我们每个月有一笔通信发票的报销，需要使用对自己在营业厅中买的发票进行校验，然后要截图留存。报销的时间有时候是3个月一次，有时候是半年，所以累积下来有不少发票，这些发票都需要校验和截图才能报销。

我们应届生刚工作的时候，我们大部分新员工都是手工截图，非常笨拙，且耗时。由于是搞技术的公司，于是有前端人员写了相关的前端插件来自动化截图和生成发票校验文档，然后在公司内广泛应用。我也写了这样一段基于 Selenium 的自动化截图代码，不过代码依赖 chrome 和 webdriver，所以组内的部分人会把发票的起始编号和张数发给我，我运行程序截好图后将图片打包发给他们自己放到 word 文档中去。

来看看发票校验的网站的截图如下：

图片描述

广东通信发票校验网站

验证的方式非常机械，正是因为机械操作，才给了我们自动化的可能、看上图中的四个输入框，表示的含义分别为：

发票代码：固定值；
发票号码：通常而言，从移动营业厅拿的通信发票是连续的，这样就可以用 for 循环实现；
纳税人识别号：这个是个固定值；
发票面额：固定50元。假设我买300元的卡，就会对应6张发票；

我们填好每张发票的相应信息，只有一个变量。在查询之前，需要先拖动滑块进行验证，验证通过，再点击查询就可以进行认证。得到了认证结果后，截张图，如此进行下去，直到所有的发票都校验截图完毕。令人欣慰的是这里的滑块验证只需要做一次，得到了相应的认证截图后，每次调整下一张发票的发票号码，在截一张图即可。看下面的做法：

因此，我们得到了这样的机械化动作：

打开发票校验页面；
输入第一张发票的四个参数，然后拖动滑块到最右端完成校验；
截图留存；
改动第二个输入框的发票号码，为下一个发票编号，然后直接截图；重复，直到最后一张发票截图成功；

对应这样的动作我们翻译成相应的 Selenium 自动化代码如下：

"""
测试 selenium 工具
"""
import time
import random

from selenium import webdriver
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver import ActionChains


# 固定值
ticket_code = "144011690802"
identification_number = "91440101618652334F"
face_value = 50

# 起始编号
ticket_start_num = 15415104
# 发票总数
total_count = 10


def click_space(driver):
    """
    点击下空白处，使得输入框失去焦点
    """
    driver.find_elements_by_xpath('//div[@class="check-main"]/table/tbody/tr[1]/td[1]')[0].click()


def fill_input(driver, idx):
    """
    填充输入框
    """
    input_value = [ticket_code, idx, identification_number, face_value]
    table = driver.find_elements_by_xpath('//div[@class="check-main"]/table/tbody')[0]
    for i in range(1, len(input_value) + 1):
        input = table.find_elements_by_xpath(f'./tr[{i}]/td[2]/input')[0] 
        input.clear()
        input.send_keys(input_value[i - 1])
    click_space(driver)


def get_track(distance):      
    """
    参考文献2代码，模拟人移动鼠标
    :distance为传入的总距离
    """
    # 移动轨迹
    track = []
    # 当前位移
    current = 0
    # 减速阈值
    mid = distance * 3 / 5
    # 计算间隔
    t = 0.4
    # 初速度
    v = 1

    while current < distance:
        if current < mid:
            # 加速度为一个随机值
            a = random.randint(2, 6)
        else:
            # 加速度为一个随机负值
            a = -1 * random.randint(1, 2)
        v0 = v
        # 当前速度
        v = v0 + a * t
        # 移动距离
        move = v0 * t + 0.5 * a * t * t
        # 当前位移
        current += move
        # 加入轨迹
        track.append(round(move))
    return track


def move_to_gap(slider, tracks):
    """
    参考文献2代码
    :slider是要移动的滑块,tracks是要传入的移动轨迹
    """
    action = ActionChains(driver)
    action.click_and_hold(slider).perform()
    for x in tracks:
        ActionChains(driver).move_by_offset(xoffset=x,yoffset=0).perform()
    time.sleep(0.1)
    ActionChains(driver).release().perform()

# 发票校验地址
verify_address = "https://gs.etax-gd.gov.cn/gsyw/service/fpyw/fpcy/index"

# 想屏蔽selenium标识，避免被服务端检测到，似乎没起作用
options = webdriver.ChromeOptions()
options.add_experimental_option("excludeSwitches", ['enable-automation'])
driver = webdriver.Chrome(options=options, executable_path="C:/Users/spyinx/AppData/Local/Google/Chrome/Application/chromedriver.exe")
driver.maximize_window()

# 第一步先去发票查询页面
driver.get(verify_address)

# 等待滑块出现
WebDriverWait(driver, 10).until(
    EC.visibility_of_element_located((By.ID, 'nc_1_n1z'))
)

# 填充输入框
fill_input(driver, ticket_start_num)
# 等待几秒后
driver.implicitly_wait(5)

# 找到滑动按钮，模拟鼠标按下不松开
slider = driver.find_element_by_id('nc_1_n1z')
move_to_gap(slider, get_track(300))

driver.implicitly_wait(2)
driver.find_element_by_id("CxBtn").click()

# 查询第一个需要滑动滑块
driver.get_screenshot_as_file(f"{ticket_start_num}.png")

for i in range(1, total_count):
    ticket_num = ticket_start_num + i
    fill_input(driver, ticket_num)
    driver.get_screenshot_as_file(f"{ticket_num}.png")
    driver.implicitly_wait(1)

上面的代码已经做好了详细的注释，请查找相关资料了解 Selenium 提供的相关方法，比如定位页面元素的方法、对页面元素点击(click)、输入框情况 (clear) 以及输入元素(send_keys) 以及鼠标的相关操作方法。下面我们直接来看代码的演示效果，最后的截图也全部得到。

注意：由于这个滑动验证码是接入的阿里滑动验证码插件，具备超强的反爬虫能力，能识别出是浏览器否被 selenium 控制。本次测试重复了无数次，才终于有一次没有出现滑块校验错误，才成功录下此视频。具体的可以搜索大神如何破解阿里的滑动验证码，不过大部分代码已经过时，无法突破验证。

总而言之，上面的操作是不是一定程度上能帮助我们减少手工操作，节约了时间成本？如果大家感兴趣的话，可以尝试使用 Selenium 完成京东商城的自动登录操作，这里会有滑动图片缺口补全的校验，会稍微有点复杂，对你们来说也是一个不错的挑战。

3. 小结

本小节中我们介绍了自动化工具 Selenuim 的使用，同时结合 Scrapy 框架了完成了一个简单的案例。这个案例来源于笔者公司的一个小需求，学习好技术有时能给我们工作和生活带来许多意想不到的惊喜，这也是我们能不断追求技术的一个动力。

深入使用 Splash 服务

Scrapy与 Selenium 的结合使用

我要提出意见反馈

热搜

最近搜索 清空

我的购物车

已加入门课程

购物车里空空如也

Scrapy 入门教程

前端开发

JavaScript

JavaScript 入门教程

TypeScript 入门教程

Vue 入门教程

Ajax 入门教程

ES6-10 入门教程

Yarn 入门教程

ECharts 入门教程

HTML & CSS

CSS3 入门教程

雪碧图入门教程

移动端布局教程

Html5 入门教程

Sass 入门教程

HTML 入门教程

canvas 入门教程

uni-app 入门教程

服务端相关

服务器

Nginx 入门教程

HTTP 入门教程

Docker 入门教程

Shell 入门教程

Linux 入门教程

开发工具

Gradle 入门教程

Vim 编辑器教程

RESTful 规范教程

Dreamweaver 教程

Markdown 入门教程

Maven 入门教程

Eclipse 编辑器教程

GitHub 入门教程

Android Studio 编辑器教程

PyCharm 编辑器教程

Sublime Text 使用教程

Postman 教程

Git入门教程

热门服务端语言

C 语言入门教程

Go 入门教程

Kotlin 教程

Ruby 入门教程

ThinkPHP 入门教程

Java

基础应用

Java 入门教程

Android 入门教程

算法入门教程

数据结构入门教程

Lambda 表达式教程

Java 并发原理入门教程

设计模式入门教程

Java并发工具

JVM 入门教程

RabbitMQ 入门教程

网络编程入门教程

后端通用面试教程

框架应用

Spring Boot 入门教程

Spring 入门教程

Hibernate 入门教程

MyBatis 入门教程

Spring MVC 入门教程

Swagger 入门教程

Zookeeper 入门教程

Netty 教程

Spring Security

微服务

Spring Cloud Hystrix

Python

基础应用

Python 入门语法教程

最近搜索清空