-
soup是一个html_doc,用三种方式检索节点。查看全部
-
快速高效的查找和分析字符串. 也可以用于验证一个字符串是否符合某个给定的规则. 使用正则表达式,可以: 测试字符串的某个模式。例如,可以对一个输入字符串进行测试,看在该字符串是否存在一个电话号码模式或一个信用卡号码模式。这称为数据有效性验证。 替换文本。可以在文档中使用一个正则表达式来标识特定文字,然后可以全部将其删除,或者替换为别的文字。 根据模式匹配从字符串中提取一个子字符串。可以用来在文本或输入字段中查找特定文字。查看全部
-
创建BeautifulSoup对象查看全部
-
搜索和访问的方式查看全部
-
访问节点的信息查看全部
-
建立beautifulsoup对象,并且按照节点搜索查看全部
-
html的DOM树结构查看全部
-
③加入cookie的访问查看全部
-
①直接访问一个url ②伪装成一个浏览器访问url查看全部
-
面对需要cookie的解决方面查看全部
-
特殊情境处理: 1.需要用户登录才能访问(HTTPCookieProcessor) 2.需要代理才能访问(ProxyHandler) 3.协议使用HTTPS加密访问(HTTPSHandler) 4.URL自动跳转(HTTPRedirectHandler)查看全部
-
提交用户数据+伪装查看全部
-
网页下载器 import urllib.request response = urllib.request.urlopen('http://www.baidu.com') print(response.getcode())#通过判断是不是200来确定是否下载成功查看全部
-
简单爬虫查看全部
-
结构化解析 dom查看全部
举报
0/150
提交
取消