课程
                    
                        /后端开发
                        
                            /Python
                        
                        /Python开发简单爬虫

请问方法二的"request"请求和方法三的“cj"容器哪儿错了?

import urllib.request    # Python之后urllib2改为urllib.request

print("方法一")
url = "https://dxy.com/faq"
response_1 = urllib.request.urlopen(url)
print(response_1.getcode())    # 截取状态码，是200则成功
# print(response_1.read())     # 未解码
print(len(response_1.read()))

print("\n方法二")
request = urllib.request(url)      # 错误一
request.add_header("user-agent","Mozilla/5.0 ")    # 将爬虫伪装成浏览器
response_2 = urllib.request.urlopen(request)
print(response_2.getcode())
print(len(response_2.read()))

print("\n方法三")
cj = cookielib.CookieJar()         # 错误二
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
urllib.request.install_opener(opener)
response_3 = urllib.request.urlopen(url)
print(response_3.getcode())    # 截取状态码，是200则成功
print cj
print(len(response_3.read()))

慕粉7380412

2019-08-29

源自：Python开发简单爬虫 5-3

关注问题我要回答

736

操作

收起

2 回答

慕九州4113299 回答被采纳 +2 积分
2019-08-29

第三个地方我还用了了

import http.cookiejar

cj = http.cookiejar.CookieJar()

0 回复有任何疑惑可以回复我~

收起回答

慕粉7380412 提问者

万分感谢！

2019-08-30 回复有任何疑惑可以回复我~

慕九州4113299
2019-08-29

request = urllib.request(url)      # 错误一

这里是request = urllib.request.Request(url) #返回的是一个request对象

cj = cookielib.CookieJar()         # 错误二

0 回复有任何疑惑可以回复我~

收起回答

0/150

提交

取消

Python开发简单爬虫

参与学习 227753 人
解答问题 1218 个

本教程带您解开python爬虫这门神奇技术的面纱

进入课程

请问方法二的"request"请求和方法三的“cj"容器哪儿错了?

我要回答关注问题

热搜

最近搜索清空

请问方法二的"request"请求和方法三的“cj"容器哪儿错了?

2 回答

请问方法二的"request"请求和方法三的“cj"容器哪儿错了?