已解决430363个问题，去搜搜看，总会有你想问的

请帮我看看这段爬取怎么错了

首页猿问请帮我看看这段爬取怎么错了

请帮我看看这段爬取怎么错了

爬虫

慕仔8323353 2018-11-01 23:07:05

# coding=utf-8def getHTMLlines(htmlpath): f=open(htmlpath,"r",encoding="utf-8") ls=f.readlines() f.close() return lsdef extractImageUrls(htmllist): urls=[] for line in htmllist: if "img"in line: url=line.split("src=")[-1].split('"')[1] if "http"in url: urls.append(url) return urlsdef showResults(urls): count=0 for url in urls: print("第{:2}个的URL:{}".format(count,url)) count +=1def saveResults(filepath,urls): f=open(filepath,"w") for url in urls: f.write(url+"\n") f.close()def main(): inputfile="F:/html/nationalgeographic.html" outfile="F:/html/ues.txt" htmlLines=getHTMLlines(inputfile) imageUrls=extractImageUrls(htmlLines) showResults(imageUrls) saveResults(outputfile,imageUrls)main()

查看完整描述

2 回答

2 回答
0 关注
1135 浏览

关注

添加回答

0/150

提交

取消

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

热搜

最近搜索清空

请帮我看看这段爬取怎么错了

请帮我看看这段爬取怎么错了

2 回答

添加回答