为了账号安全,请及时绑定邮箱和手机立即绑定

python如何正确抓取网页标题

python如何正确抓取网页标题

扬帆大鱼 2019-03-29 11:00:35
通过urllib将网页内容抓取下来,然后用正则表达式re模块将标题匹配出来,但是发现部分标题会出现问题,比如下面抓Apple的代码运行结果是App,测试发现匹配结果m是没有问题的,问题出现在了strip()这里。#-*-coding:utf-8-*-importurllibimportreurl='http://apple.com'html=urllib.urlopen(url).read()#printhtmlm=re.search(".*",html)printm.group()#这里输出结果Appleprintm.group().strip("")#问题应该出现在这个正则
查看完整描述

2 回答

  • 2 回答
  • 0 关注
  • 332 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号