为了账号安全,请及时绑定邮箱和手机立即绑定

使用 re 库 python 无法正确解析结束行

使用 re 库 python 无法正确解析结束行

皈依舞 2022-05-24 18:16:18
考虑字符串:<p class="sm clg" data-rlocation="Uttam Nagar East">Uttam Nagar East, Delhi <span class="to-txt" id="citytt1">B-24, East Uttam Nagar, Uttam Nagar East,<br>Delhi<span> - </span>110059我想Uttam Nagar East使用正则表达式函数得到结果,但我得到的输出是Uttam Nagar East">Uttam Nagar East, Delhi <span class="to-txt" id="citytt1'我试过使用print(re.findall(r'data-rlocation="(.*)["]',contents))和print(re.findall(r'data-rlocation="(.*)"',contents))
查看完整描述

3 回答

?
四季花海

TA贡献1811条经验 获得超5个赞

该小组(.*)在其捕获中包含了结束语。试试这个:


>>> re.findall(r'data-rlocation="([^"]*)"', contents)

['Uttam Nagar East']

在这里查看它是如何工作的。


查看完整回答
反对 回复 2022-05-24
?
摇曳的蔷薇

TA贡献1793条经验 获得超6个赞

您正在使用贪婪的正则表达式,您可以添加“?” 让它不贪心


import re

contents = '<p class="sm clg" data-rlocation="Uttam Nagar East">Uttam Nagar East, Delhi <span class="to-txt" id="citytt1">B-24, East Uttam Nagar, Uttam Nagar East,<br>Delhi<span> - </span>110059'

print(re.findall(r'data-rlocation="(.*?)"',contents))


查看完整回答
反对 回复 2022-05-24
?
小唯快跑啊

TA贡献1863条经验 获得超2个赞

使用惰性匹配进行积极的后视和积极的前瞻将起到作用。

图案:(?<=data-rlocation=").*?(?=")

代码:print(re.findall(r'(?<=data-rlocation=").*?(?=")',contents))

正则表达式 101 上的演示

解释

  • (?<=使用积极的前瞻。它不会返回字符串。它只会确保这个模式在匹配之前是正确的。

    • data-rlocation="这是要匹配的字符串

  • )关闭积极的前瞻

  • .*匹配我们要返回的字符串的每一个字符

  • ?使*懒惰(不贪婪)

  • (?=打开正向前瞻以匹配关闭模式,但不返回字符串

    • "匹配下一个双引号

  • )关闭积极的前瞻


查看完整回答
反对 回复 2022-05-24
  • 3 回答
  • 0 关注
  • 198 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号