为了账号安全,请及时绑定邮箱和手机立即绑定

关于正则表达式

关于正则表达式

慕森卡 2018-08-17 11:13:15
w我现在用python 爬取网页内用要用到正则表达式,要爬的内容时这样的是img中的 src内容我用python写的正则是这样links = re.findall('<a href=".*?".target=.*?>^[div]<img src="(.*?)".*?>.*?</a>') 可是却匹配到一些我不想要的 比如怎么改一下正则才能不匹配这个带div标签的,谢谢了
查看完整描述

1 回答

?
幕布斯7119047

TA贡献1794条经验 获得超8个赞

试试

links = re.findall('<a href=".*?".target=.*?>\s*<img src="(.*?)".*?>\s*</a>')


查看完整回答
反对 回复 2018-08-26
  • 1 回答
  • 0 关注
  • 587 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信