-
Xpathl路径表达式
Xpath使用路径表达式来选取XML文档(或是HTML文档)中的节点或节点集
路径表达式:
/div:从根节点开始选取div节点
//a:选取文档中所有的a节点而不考虑其位置
@class:选取名为class的属性
. :选取当前节点
.. :选取当前节点的父节点
ctrl+shift+x 打开Xpath
/div/a :从根节点开始选取div节点下的a节点
/div/a[@class='header-wrapper' ]
查看全部 -
请求头
查看全部 -
etree用来添加HTML和body标签
data = """ <div> <ul> <li class="item-0"><a href="link1">first</a></li> <li class="item-in"><a href="link2"><span class="bold">second</span></a></li> <li class="item-0"><a href="link3">third</a></li> </ul> </div> """ html = etree.HTML(data)
2.获取第一个li的a标签
1.print(html.xpath("//li/a[@href='link1']")) 2.print(html.xpath("//li[1]/a[1])
3.获取第二个li的span标签
1.#因为span是li的后代元素,所以要用两个// 2.print(html.xpath("//li//span"))
4.获取最后一个li里面的href(last的使用)
print(html.xpath("//li[last()]/a/@href"))
查看全部 -
设置代理——隐藏请求
查看全部 -
第二遍没太听懂
查看全部 -
搜索
复制
查看全部 -
搜索
复制
查看全部 -
关闭校验:verify=False
指定证书:verify='xxx'(某个路径)
搜索
复制
查看全部 -
session信息
查看全部 -
Requests模块构造URL
查看全部 -
PUT方法
查看全部 -
HTTP POST方法用于提交数据(如表单)
查看全部 -
Head方法请求部分信息
查看全部 -
HTTP方法GET
查看全部 -
request是一个Python三方库
查看全部
举报