python遇见数据采集_技术问答

首页免费课 python遇见数据采集问答

python遇见数据采集

                
                秋名山车神
            全栈工程师

                    查看讲师更多课程 
                    秋名山车神讲师的其他课程
                
浏览器开发者工具使用技巧
初级·41710
免费课程
                                
                难度初级
            
                时长 2小时 5分
            
                学习人数
            
综合评分9.63
                            95人评价
                        查看评价
                                9.7
                                内容实用
                            
                                9.5
                                简洁易懂
                            
                                9.7
                                逻辑清晰

全部评论问答未解决精华

无法存储的错误

最新回答 / 皓羽如风

我用的是Eclipse中PyDev 插件编程，Python2.7.12对应的MySQL版本是MySQL-python-1.2.4b4.win32-py2.7.exe，我一直使用的是cursor=connection.cursor()表达。Python2.7我没试过，但是在3.4.3中（需要安装pymysql插件）,用那个语句会报错。

1 回答 925 浏览 4-1 存储数据到MySQL

2016-09-25

资料在哪里下载

+ 我来回答回答最高可+2积分

2 回答 411 浏览 3-4 BeautifulSoup使用

2016-09-25

为啥这么报错= = ValueError: chr() arg not in range(256)

最新回答 / 慕移动9181930

可以啊，我用谷歌试过，没有问题。你没有写其他浏览器的兼容代码，所以有问题能实现就行，不过你和题目要求还是有点差别哦~你可以在进行优化一下，没有点击的时候标签下有一条线的，你可以把这个优化掉

6 回答 7912 浏览 5-5 python读取PDF文档(二)

2016-09-24

重新打开就运行不出来了

最新回答 / 小胖纸

你用的是PyCharm吧，这个说明运行正常，你把代码贴出来看看是什么个情况

1 回答 1001 浏览 3-5 获取维基百科词条信息

2016-09-17

id为啥没有设置

最新回答 / 楷格的爸爸

我的不可以，只能手动加上一个id字段，写入循环i=i+1,但写入时出现问题了，求教大家:1如何使用自动递增字段的2写入时是不是直接忽略这个字段3自增字段必须设置成主键吗？

4 回答 2234 浏览 4-1 存储数据到MySQL

2016-09-17

pdfminer3k安装失败

已采纳回答 / 秋名山车神

pdf2txt.py 前面应该加一个 python 的关键字吧不然py文件是不能直接运行的

1 回答 3721 浏览

2016-09-16

比如说你想收集所有上市公司历年来资产负债，资产增长，股份变革等等这些情况，你不可能通过人工的方法来查找，因为单单深沪都有几千家公司，只能依靠程序来完成，但是这些信息大部分都是以PDF文件保存的，如果不读取PDF文件还有什么好的方法来完成呢？而且大部分的文件都是以PDF保存的，如果你想从这些文件里面查找信息，一两个文件可能还能人工去查找统计，如果是一百个，一万个文件，依靠人工不知道要到什么时候才能完成，而且还可能会统计错误。

2 回答 1233 浏览 5-5 python读取PDF文档(二)

2016-09-15

老师用的是什么工具啊

+ 我来回答回答最高可+2积分

3 回答 2407 浏览 3-1 urllib基本用法

2016-09-10

这节课的意思是要干嘛？

最新回答 / 孤独的小猪

其实主要是为了解决以后出现乱码做基础知识，因为python爬取数据，由于编码格式问题，常常导致爬下来的数据是乱码，所以讲了一些Unicode知识。

2 回答 937 浏览 5-1 python读取TXT文档

2016-09-09

beautifulsoup这节课到底在讲？

讲师回答 / 秋名山车神

他就是方便从网页中提取数据的，只要会用基本的用法就可以了。如果以后真的有什么特殊的需求，可以去网上搜一下就行了，Python不需要把每个库的所有东西都学完，只需要在用到的时候查一下资料就可以了，也不需要去了解它内部的实现。Python开发的特点就是快，简单。如果前期花费大量的时间去学习这些库所有的东西，实际上很多都用不到，有的可能用一次就不再用了，所以没有必要花太大的信息去把一个库所有的东西研究一遍。

2 回答 1218 浏览 3-4 BeautifulSoup使用

2016-09-08