为了账号安全,请及时绑定邮箱和手机立即绑定

有没有遇到这种情况的???

有没有遇到这种情况的???

No37_国庆 2017-11-23 18:27:46
# coding=gbk ''' Created on 2017年11月23日 @author: stu ''' from baike_spider import url_manager, html_downloader, html_parser,\     html_outputer # 初始化url管理器、下载器、解析器、输出器 class SpiderMain(object):     def __init__(self):         self.urls = url_manager.UrlManager()         self.downloader = html_downloader.HtmlDownloader()         self.parser = html_parser.HtmlParser()         self.outputer = html_outputer.HtmlOutputer()                   def craw(self,root_url):         count = 1         self.urls.add_new_url(root_url)         while self.urls.has_new_url():             try:                 new_url = self.urls.get_new_url()                 print ("craw %d : %s" %(count,new_url))                 html_cont = self.downloader.download(new_url)                 new_urls, new_data = self.parser.parse(new_url,html_cont)                 self.urls.add_new_urls(new_urls)                 self.outputer.callect_data(new_data)                                  if count ==100:                     break                                  count += 1             except:                 print('craw failed')                      self.outputer.output_html() if __name__ =='__main__':     root_url = "https://baike.baidu.com/item/Python/407313?fr=aladdin"     obj_spider = SpiderMain()     obj_spider.craw(root_url)                         Traceback (most recent call last):   File "D:\eclipse\workspase\imooc\src\baike_spider\spider_main.py", line 45, in <module>     obj_spider.craw(root_url)   File "D:\eclipse\workspase\imooc\src\baike_spider\spider_main.py", line 23, in craw     self.urls.add_new_url(root_url) TypeError: add_new_url() takes 1 positional argument but 2 were given
查看完整描述

3 回答

?
XO鸡丝

TA贡献26条经验 获得超7个赞

有几个疑问:

self.urls.add_new_url(root_url)

这个是啥意思?函数的话,代码是?返回值是?


查看完整回答
反对 回复 2017-11-24
  • 3 回答
  • 0 关注
  • 1927 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信