-
安装BeautifulSoup4查看全部
-
各个系统配置命令查看全部
-
安装BS4查看全部
-
数据采集查看全部
-
python 连接 mysql 数据库 pymysql查看全部
-
Python3 读取 pdf 文件的库 pdfminer3k查看全部
-
urllib 请求 web 服务器 beautiful soul 解析返回的结果 re 进行正则处理查看全部
-
1. print(soup.find(id="link2").string) #获取link2标签的内容; 2. for link in soup.findAll("a"): print(link.string) #查找A标签下面所有的内容,利用For循环实现查看全部
-
爬虫查看全部
-
from urllib.request import urlopen # 引入urlopen 模块 from urllib.request import Request # 引入urlrequest 模块 from urllib import parse # 引入parse 模块 req = Request("http://www.thsrc.com.tw/tw/TimeTable/SearchResult") postDate = parse.urlencode([ ("StartStation", "2f940836-cedc-41ef-8e28-c2336ac8fe68"), ("EndStation", "977abb69-413a-4ccf-a109-0272c24fd490"), ("SearchDate", "2016/08/31"), ("SearchTime", "21:30"), ("SearchWay", "DepartureInMandarin") ]) req.add_header("Origin", "http://www.thsrc.com.tw") req.add_header("User-Agent", "Mozilla/5.0 (Windows NT 6.1; rv:48.0) Gecko/20100101 Firefox/48.0)") resp = urlopen(req,data=postDate.encode("utf-8")) print(resp.read().decode("utf-8"))查看全部
-
输入代码的时候需要注意大小写、半角、全角符号都对结果有些影响。查看全部
-
from urllib.request import urlopen # 引入urlopen 模块 from urllib.request import Request # 引入urlrequest 模块 from urllib import parse # 引入parse 模块 req = Request("http://www.thsrc.com.tw/tw/TimeTable/SearchResult") postDate = parse.urlencode([ ("StartStation", "2f940836-cedc-41ef-8e28-c2336ac8fe68"), ("EndStation", "977abb69-413a-4ccf-a109-0272c24fd490"), ("SearchDate", "2016/08/31"), ("SearchTime", "21:30"), ("SearchWay", "DepartureInMandarin") ]) req.add_header("Origin", "http://www.thsrc.com.tw") req.add_header("User-Agent", "Mozilla/5.0 (Windows NT 6.1; rv:48.0) Gecko/20100101 Firefox/48.0)") resp = urlopen(req,data=postDate.encode("utf-8")) print(resp.read().decode("utf-8"))查看全部
-
Python1查看全部
-
代码块2查看全部
-
代码块查看全部
举报
0/150
提交
取消