python遇见数据采集_技术问答

首页免费课 python遇见数据采集问答

python遇见数据采集

                
                秋名山车神
            全栈工程师

                    查看讲师更多课程 
                    秋名山车神讲师的其他课程
                
浏览器开发者工具使用技巧
初级·41708
免费课程
                                
                难度初级
            
                时长 2小时 5分
            
                学习人数
            
综合评分9.63
                            95人评价
                        查看评价
                                9.7
                                内容实用
                            
                                9.5
                                简洁易懂
                            
                                9.7
                                逻辑清晰

全部评论问答未解决精华

耕石

之前讲过的这个方式
html = urlopen("https://en.wikipedia.org/robots.txt").read().decode("utf-8")
print(html)

爬出来的结果，似乎还更有秩序一些？

0 5-1 python读取TXT文档

2019-11-30

为什么我的那么短

已采纳回答 / 耕石

截图完全看不清楚啊。。。

1 回答 1131 浏览 3-1 urllib基本用法

2019-11-19

python能修改双层pdf中文字透明度吗

+ 我来回答回答最高可+2积分

2 回答 1370 浏览 5-5 python读取PDF文档(二)

2019-10-17

为啥我读取PDF报错？求大佬指点一下，谢谢！

+ 我来回答回答最高可+2积分

0 回答 1413 浏览

2019-09-14

读取不了wiki那个url链接,求助。。

最新回答 / qq_主教练_0

可以爬取wiki百科中文网

2 回答 1254 浏览 3-5 获取维基百科词条信息

2019-09-03

求教到底那里除了问题，不能用for循环吗？照着视频敲的，为什么说索引超出范围？

最新回答 / 慕田峪8063247

没看出来，好像说的是你的pdfparser.py这个文件报错了，但是这个文件是你下载下来的，应该不会出问题的。

1 回答 873 浏览 5-5 python读取PDF文档(二)

2019-08-29

PDFPageAggregator()出错 TypeError: init() missing 1 required positional argument: 'rsrcmgr'

+ 我来回答回答最高可+2积分

3 回答 1833 浏览 5-5 python读取PDF文档(二)

2019-08-16

海家上瘾

精通课程就可以打造google这样的公司，发家致富哈哈哈哈哈啊哈

0 7-1 python数据采集-课程总结

2019-08-16

海家上瘾

pip install pdfminer3k

0 5-2 pdfminer3k安装

2019-08-16

pip install BeautifulSoup4安装失败

最新回答 / Sky4480

cd 到 C:\Python36-32\Scripts\ 目录下：发现有 pip.exe pip3.exe pip36.exe ,删除前两个文件，保留想要的pip36.exe随后测试，成功。C:\Python36-32\Scripts>pip36 -Vpip 19.1.1 from c:\python36-32\lib\site-packages\pip (python 3.6)

1 回答 2135 浏览 2-1 python开发环境搭建

2019-08-13

req = request.Request('https://search.bilibili.com/all?keyword=%E5%BE%90%E5%A4%A7SAO') 目前这样只能爬取一页的数据，如何把全部数据爬取下来，求教？

最新回答 / 蒙奇_D_路飞

url修改成：https://api.bilibili.com/x/web-interface/search/type?search_type=video&highlight=1&keyword=%E5%BE%90%E5%A4%A7SAO&page=3&jsonp=jsonp&callback=__jp1直接设置page就可以了

1 回答 1620 浏览 3-5 获取维基百科词条信息

2019-08-10

request问题-为什么出现这个问题

最新回答 / Sky4480

request = urllib.request.Request(url)
改成这样试试

1 回答 1141 浏览 3-1 urllib基本用法

2019-08-01

如何单独提取出带有下划线的文字呢

最新回答 / 慕雪芸茗

你可以使用全局的正则匹配来匹配整个字符串达到这个效果，提示你一下，匹配中文汉字的正则是[u4e00-u9fa5]

1 回答 1738 浏览 5-5 python读取PDF文档(二)

2019-06-20

课件代码怎么没有

最新回答 / 史志涛

不要着急唉，慢慢往后看着急敲代码完成，根本不需要课件代码哦

1 回答 978 浏览 3-4 BeautifulSoup使用

2019-04-23

首页上一页 1 2 3 4 5 6 7 下一页尾页

开始学习

课程须知: 熟悉Python语言的语法，掌握Python的正则表达式模块，懂得如何使用Python操作数据库

老师告诉你能学到什么？: 使用Python内置urllib模块和第三方BeautifulSoup模块进行数据采集和提取、MySQL数据库的操作、TXT和PDF文档的读取，以及robots协议和相关注意事项

微信扫码，参与3人拼团

热搜

最近搜索清空

python遇见数据采集