为了账号安全,请及时绑定邮箱和手机立即绑定

Python最火爬虫框架Scrapy入门与实践

难度初级
时长 1小时31分
学习人数
综合评分95.7
47人评价 查看评价
9.7 内容实用
9.6 简洁易懂
9.4 逻辑清晰

已采纳回答 / bwqyongyuan
content=i_item.xpath(".//div[@class='info']//div[@class='bd']/p[1]/text()").extract()
content_s=''
for i_content in content:
    content_s+="".join(i_content.split())
douban_item['introduce']=content_s

讲师回答 / 大壮老师
你标注的地方没有错误,前面301跳转了,需要访问https页面,不是http页面

讲师回答 / 大壮老师
可以直接使用命令行工具,在终端内输入mongo即可

讲师回答 / 大壮老师
linux系统包管理命令yum,python包管理命令pip,直接安装即可,不需要提前下载安装包

讲师回答 / 大壮老师
需要贴出详细报错日志

讲师回答 / 大壮老师
这不是debug的报错,这是你没有设置robots的报错

已采纳回答 / Thistledown
<...code...>试着改为 extract() 而不是 extract_first()希望对你有帮助

最赞回答 / 慕容0352477
request.meta['Proxy'] = 'http-pro.abuyun.com:9010'
我是把‘proxy'改为'Proxy'后好像可以了

已采纳回答 / weixin_mo
在python 代码中加入```sys.path.append(os.path.abspath(os.path.join(os.getcwd(), "..")))  # 当前项目路径加入```可尝试解决办法:配置文件的工作路径   working directory

最赞回答 / SeaRhyme
有可能是数据库初始化函数里面的内容没有运行到,__init__(self)这个名字init左右都是双下划线,pycharm写对了会变色的
首页上一页123下一页尾页
课程须知
1、具有一定的Python基础 2、具有一定的linux系统管理基础,编译安装软件,yum包管理工具等 3、具有一定的Mongdb数据库管理基础,增删改查
老师告诉你能学到什么?
1、scrapy框架简介、数据在框架内如何进行流动 2、scrapy框架安装、mongodb数据库安装 3、scrapy抓取项目如何创建 4、scrapy抓取项目如何进行数据解析 5、scrapy抓取项目如何绕过反爬机制抓取数据 6、scrapy抓取项目如何存储数据到不同的格式
意见反馈 邀请有奖 帮助中心 APP下载
官方微信

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消