python遇见数据采集_学习笔记

首页免费课 python遇见数据采集笔记

python遇见数据采集

                
                秋名山车神
            全栈工程师

                    查看讲师更多课程 
                    秋名山车神讲师的其他课程
                
浏览器开发者工具使用技巧
初级·41720
免费课程
                                
                难度初级
            
                时长 2小时 5分
            
                学习人数
            
综合评分9.63
                            95人评价
                        查看评价
                                9.7
                                内容实用
                            
                                9.5
                                简洁易懂
                            
                                9.7
                                逻辑清晰

最热最新

慕容7012403

soup = bs(html_doc,"html.parse")

print(soup.title.string)#当title不止一个时会报错
print(soup.title.get_text())
print(soup.a)
print(soup.find(id="link2").get_text)
print(soup.find(id="link2").string)
#print(soup.findAll("a").string)
for link in soup.findAll("a"):
print(link.string)
print(soup.find("p",{"class":"story"}))

查看全部

0 采集收起来源：BeautifulSoup使用
2019-03-10
慕容7012403

post是应用在响应对象中（即要求你下指令之后网页响应的信息）
谷歌内可以使用postman进行查看你想要响应的对象内容是什么

查看全部

0 采集收起来源：使用urllib发送post请求
2019-03-10
慕容7012403

反爬虫还有一个：origin

查看全部

0 采集收起来源：使用urllib发送post请求
2019-03-10
慕容7012403

携带请求头的爬虫是最简单的反爬虫的方法：
rep = requst.Requst(url)
rep.add_header(key,value)
resp = request.urlopen(req)
print(resp.read().decode("utf-8")

查看全部

0 采集收起来源：urllib基本用法
2019-03-10
RUNCENT 00:41

读取文件方式

查看全部

0 采集收起来源：python读取PDF文档(二)
2019-02-26
慕容7012403

Python安装pip

查看全部

0 采集收起来源：python数据采集-课程介绍
2019-02-23
RUNCENT 05:55

使用post2

查看全部

0 采集收起来源：urllib基本用法
2019-02-05
RUNCENT 05:48

使用post1

查看全部

0 采集收起来源：urllib基本用法
2019-02-05
RUNCENT 02:39

模拟浏览器访问

查看全部

0 采集收起来源：urllib基本用法
2019-02-03
RUNCENT 00:47

urllib

查看全部

0 采集收起来源：urllib基本用法
2019-02-03
慕神2407217

Python3字符串默认使用Unicode编码，所以Python3支持多语言。
以Unicode表示的str通过encode()方法可以编码为指定的bytes。
如果bytes使用ASCII编码，遇到ASCII码表没有的字符会以\x##表示，此时只用'\x##'.decode('utf-8')就可以了

查看全部

0 采集收起来源：python读取TXT文档
2019-01-30
大余_ 05:06

发送POST请求

查看全部

0 采集收起来源：urllib基本用法
2018-12-20
大余_ 04:07

携带header

查看全部

0 采集收起来源：urllib基本用法
2018-12-20

慕娘9010613 00:44

from urllib import request
resp = request.urlopen("http://www.baidu.com")
print(resp.read().decode("utf-8"))

查看全部

0 采集收起来源：urllib基本用法

2018-11-21

慕勒6273157 00:15

urllib库

查看全部

0 采集收起来源：urllib基本用法
2018-11-08

首页上一页 2 3 4 5 6 7 8 下一页尾页

0/150

提交

取消

开始学习

课程须知: 熟悉Python语言的语法，掌握Python的正则表达式模块，懂得如何使用Python操作数据库

老师告诉你能学到什么？: 使用Python内置urllib模块和第三方BeautifulSoup模块进行数据采集和提取、MySQL数据库的操作、TXT和PDF文档的读取，以及robots协议和相关注意事项

微信扫码，参与3人拼团

热搜

最近搜索清空

python遇见数据采集