Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

output出来的不是汉字，而是字符

+ 我来回答回答最高可+2积分

4 回答 5199 浏览 7-7 开始运行爬虫和爬取结果展示

2018-09-29

大佬们帮忙看看有啥问题啊为什么说主函数没有变量 urls啊

最新回答 / 慕移动9181930

跟着教程又做一遍，又对了老师还会有新课程哒~敬请期待

1 回答 1037 浏览 7-2 调度程序

2018-09-28

报错啊 AttributeError: 'SpriderMain' object has no attribute 'urls'

最新回答 / lenmon2018

你没有声明就用了。你应该写代码时，不小心写错了导致的

1 回答 844 浏览 7-2 调度程序

2018-09-28

soup.find_all('a',href=re.compile(r"\”")) 为什么会匹配不到双引号

+ 我来回答回答最高可+2积分

0 回答 2397 浏览

2018-09-26

返回None之后的调用会报错

+ 我来回答回答最高可+2积分

2 回答 922 浏览 7-4 HTML下载器html_downloader

2018-09-26

我只爬到了一行

最新回答 / L杉

看一下网页下载器中判断获取成功的语句有没有错，用response.staus_code。正则表达式用

'/item/'试试

5 回答 1025 浏览 8-1 课程总结

2018-09-26

除了第一个，全部显示词条已锁定，为什么会这样啊？？？？有没有大佬帮忙解答一下

最新回答 / longmoxxx

应该是连接取的不对吧。百科的网页有更新。试试这个

links = soup.find_all('a',href=re.compile(r"/item/"))

1 回答 1353 浏览 7-2 调度程序

2018-09-25

为什么Ctrl+1都没有反应啊

最新回答 / 慕设计0280319

是不是你的快捷键设置被改过了，spyder是用Ctrl+1是可以注释的

2 回答 1995 浏览 7-2 调度程序

2018-09-22

def output_html(self):的 for data in self.datas: 说没有 datas

最新回答 / 慕尼黑8853887

自己粗心大意导致的

1 回答 923 浏览 7-6 HTML输出器

2018-09-20

为什么我的最后结果只爬出来4个

最新回答 / 宁_静_致_远

首先把try except去掉，看看程序运行报的什么错，然后根据错误找到对应的解决办法

1 回答 894 浏览 7-7 开始运行爬虫和爬取结果展示

2018-09-20

anaconda python2 编码问题

+ 我来回答回答最高可+2积分

2 回答 2151 浏览 7-2 调度程序

2018-09-19

我想知道本课程案例需要哪些包，我很头疼啊

最新回答 / 冰舞魅火

pycharm就行了

1 回答 885 浏览 1-1 Python开发简单爬虫课程介绍

2018-09-19

request.add_data报错啊

最赞回答 / 相食尽

是不是1后面多打了一个逗号

2 回答 1309 浏览 5-2 Python爬虫urlib2下载器网页的三种方法

2018-09-19

是否只能用Python2

最新回答 / 慕仰4611779

Pyhton3可以实现，我已经试过可以跑起来。代码见链接https://github.com/wangjun1996/baike_spider.git

2 回答 980 浏览 5-3 Python爬虫urlib2实例代码演示

2018-09-17

只爬取了四行就结束怎么回事啊

+ 我来回答回答最高可+2积分

0 回答 677 浏览 7-6 HTML输出器

2018-09-16

首页上一页 12 13 14 15 16 17 18 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空

Python开发简单爬虫