python遇见数据采集_学习笔记

首页免费课 python遇见数据采集笔记

python遇见数据采集

                
                秋名山车神
            全栈工程师

                    查看讲师更多课程 
                    秋名山车神讲师的其他课程
                
浏览器开发者工具使用技巧
初级·41720
免费课程
                                
                难度初级
            
                时长 2小时 5分
            
                学习人数
            
综合评分9.63
                            95人评价
                        查看评价
                                9.7
                                内容实用
                            
                                9.5
                                简洁易懂
                            
                                9.7
                                逻辑清晰

最热最新

艾小科 03:21

安装BeautifulSoup4

查看全部

0 采集收起来源：python开发环境搭建
2016-09-19
奋斗的罗曼史 03:37

各个系统配置命令

查看全部

0 采集收起来源：python开发环境搭建
2016-09-19
昵称2_18位中英文 03:17

安装BS4

查看全部

0 采集收起来源：python开发环境搭建
2016-09-16
Pandaer 00:36

数据采集

查看全部

0 采集收起来源：python数据采集-课程介绍
2016-09-13
chenishr 03:42

python 连接 mysql 数据库 pymysql

查看全部

0 采集收起来源：python数据采集-课程总结
2016-09-05
chenishr 00:08

Python3 读取 pdf 文件的库 pdfminer3k

查看全部

0 采集收起来源：python读取PDF文档(一)
2016-09-05
chenishr 00:09

urllib 请求 web 服务器 beautiful soul 解析返回的结果 re 进行正则处理

查看全部

0 采集收起来源：查询MySQL数据
2016-09-05
慕粉3878587

1. print(soup.find(id="link2").string) #获取link2标签的内容； 2. for link in soup.findAll("a"): print(link.string) #查找A标签下面所有的内容，利用For循环实现

查看全部

0 采集收起来源：BeautifulSoup使用
2018-03-22
星河飞雁

爬虫

查看全部

0 采集收起来源：python开发环境搭建
2016-08-31
慕粉3878587

from urllib.request import urlopen # 引入urlopen 模块 from urllib.request import Request # 引入urlrequest 模块 from urllib import parse # 引入parse 模块 req = Request("http://www.thsrc.com.tw/tw/TimeTable/SearchResult") postDate = parse.urlencode([ ("StartStation", "2f940836-cedc-41ef-8e28-c2336ac8fe68"), ("EndStation", "977abb69-413a-4ccf-a109-0272c24fd490"), ("SearchDate", "2016/08/31"), ("SearchTime", "21:30"), ("SearchWay", "DepartureInMandarin") ]) req.add_header("Origin", "http://www.thsrc.com.tw") req.add_header("User-Agent", "Mozilla/5.0 (Windows NT 6.1; rv:48.0) Gecko/20100101 Firefox/48.0)") resp = urlopen(req,data=postDate.encode("utf-8")) print(resp.read().decode("utf-8"))

查看全部

0 采集收起来源：使用urllib发送post请求
2018-03-22
慕粉3878587

输入代码的时候需要注意大小写、半角、全角符号都对结果有些影响。

查看全部

0 采集收起来源：使用urllib发送post请求
2016-08-31
慕粉3878587

from urllib.request import urlopen # 引入urlopen 模块 from urllib.request import Request # 引入urlrequest 模块 from urllib import parse # 引入parse 模块 req = Request("http://www.thsrc.com.tw/tw/TimeTable/SearchResult") postDate = parse.urlencode([ ("StartStation", "2f940836-cedc-41ef-8e28-c2336ac8fe68"), ("EndStation", "977abb69-413a-4ccf-a109-0272c24fd490"), ("SearchDate", "2016/08/31"), ("SearchTime", "21:30"), ("SearchWay", "DepartureInMandarin") ]) req.add_header("Origin", "http://www.thsrc.com.tw") req.add_header("User-Agent", "Mozilla/5.0 (Windows NT 6.1; rv:48.0) Gecko/20100101 Firefox/48.0)") resp = urlopen(req,data=postDate.encode("utf-8")) print(resp.read().decode("utf-8"))

查看全部

0 采集收起来源：使用urllib发送post请求
2018-03-22
PieceByPiece 00:36

Python1

查看全部

0 采集收起来源：BeautifulSoup使用
2016-08-31
asyangfei360 02:57

代码块2

查看全部

0 采集收起来源：查询MySQL数据
2016-08-30
asyangfei360 04:28

代码块

查看全部

0 采集收起来源：查询MySQL数据
2016-08-30