Python最火爬虫框架Scrapy入门与实践_技术问答

首页免费课 Python最火爬虫框架Scrapy入门与实践问答

Python最火爬虫框架Scrapy入门与实践

                
                大壮老师
            Python工程师

                    查看讲师更多课程 
                    大壮老师讲师的其他课程
                
网络安全高薪人才培养计划-8大网络攻防场景实战
实战·中级·113

                                                                                                                                    ￥429.00
                                            
0基础开发简单爬虫
慕课微课·入门·3188

                                                                                                                                    ￥88.00
                                            
Python爬虫实战数据可视化分析
慕课微课·初级·4276

                                                                                                                                    ￥69.00
                                            
                难度初级
            
                时长 1小时31分
            
                学习人数
            
综合评分9.53
                            55人评价
                        查看评价
                                9.7
                                内容实用
                            
                                9.4
                                简洁易懂
                            
                                9.5
                                逻辑清晰

全部评论问答未解决精华

家星

window10 python3.6下安装 scrapy
一步到位
cmd-->pip install scrapy
我安装的时候提示 Twisted安装失败，然后在这个网站https://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy
下载了Twisted的whl文件，然后将这个文件放在python的scripts下，然后pip install+ (whl文件的完整文件名)，最后重新pip install scrapy一下就完成了，可以cmd-->scrapy -h ，成功的话，会提示Scrapy 1.5.1 - no active project

6 2-1 scrapy的安装、和安装中遇到的问题

2018-10-16

完全按照老师写的代码报错twisted.web.error.SchemeNotSupported: Unsupported scheme: b''

最赞回答 / 慕容0352477

request.meta['Proxy'] = 'http-pro.abuyun.com:9010'

我是把‘proxy'改为'Proxy'后好像可以了

7 回答 4105 浏览 2-9 ip代理中间件编写

2018-10-15

xpath路径正则

最新回答 / qq_半字浅眉_1

有，/ 从根节点选取 // 从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置。

1 回答 1000 浏览 2-7 spider文件的编写（2）

2018-10-15

main.py文件在ssh里面可以执行，但是到了pycharm就不行了

已采纳回答 / 慕尼黑7825836

在python 代码中加入```sys.path.append(os.path.abspath(os.path.join(os.getcwd(), ".."))) # 当前项目路径加入```可尝试解决办法：配置文件的工作路径 working directory

1 回答 2129 浏览 2-7 spider文件的编写（2）

2018-10-13

代码运行出现溢出

+ 我来回答回答最高可+2积分

0 回答 1277 浏览

2018-10-12

请问老师8分56秒您说的输入冒号w是啥意思啊。。。

最新回答 / FaithLIZ

vim中保存的意思，wq保存退出

2 回答 1244 浏览 2-6 spider文件的编写（1）

2018-10-12

windows10系统下报错代理ip的问题

最新回答 / 葱油拌面

已解决，

request.headers['Proxy-Authorization'] = 'Basic' + encode_pass_name.decode()

'Basic'  -----加空格------>  'Basic '

1 回答 2210 浏览

2018-10-11

spider 用不了，

最新回答 / 慕仔3469222

重新写个main函数，里面写from scrapy import cmdlinecmdline.execute（‘scrapy crawl mydodin’.split（）），然后运行main文件即可或者用命令行来运行你成功生成了spider项目说明安装没问题，只是你运行的文件错了。

1 回答 1293 浏览 2-6 spider文件的编写（1）

2018-10-11

为啥我安装后使用spider在pycharm提示AttributeError: module 'scrapy' has no attribute 'Spider'

最新回答 / 慕姐1218095

你scrapy没有装成功吧···

1 回答 2791 浏览 2-1 scrapy的安装、和安装中遇到的问题

2018-10-11

xusiman

3.7.0就有这个坑，3.6.6正常

2 2-1 scrapy的安装、和安装中遇到的问题

2018-10-10

怎么导入base64呀，有红色底线说明有错吗我的数据也输不出来了

最赞回答 / touch_the_dream

不是de是en，看清楚方法，比较容易弄错你写的是

base64.b64decode(proxy_name_pass)

正确的是

base64.b64encode(proxy_name_pass)

5 回答 1601 浏览 2-9 ip代理中间件编写

2018-10-10

皎然123

已学完，感谢分享，有机会亲手试验下

0 2-11 最后的注意事项

2018-10-09

首页上一页 16 17 18 19 20 21 22 下一页尾页

开始学习

课程须知: 1、具有一定的Python基础 2、具有一定的linux系统管理基础，编译安装软件，yum包管理工具等 3、具有一定的Mongdb数据库管理基础，增删改查

老师告诉你能学到什么？: 1、scrapy框架简介、数据在框架内如何进行流动 2、scrapy框架安装、mongodb数据库安装 3、scrapy抓取项目如何创建 4、scrapy抓取项目如何进行数据解析 5、scrapy抓取项目如何绕过反爬机制抓取数据 6、scrapy抓取项目如何存储数据到不同的格式

微信扫码，参与3人拼团

热搜

最近搜索清空

Python最火爬虫框架Scrapy入门与实践