为了账号安全,请及时绑定邮箱和手机立即绑定

python正则表达式的问题

python正则表达式的问题

aluckdog 2018-07-18 19:04:29
<divclass="lib-cat"><h3>分类索引</h3><divclass="list"><ul><li><ahref="/search/movie">电影</a></li><li><ahref="/search/tv">电视剧</a></li><li><ahref="/search/show">综艺</a></li></ul></div>想匹配出 电影,电视剧,综艺的链接,形成一个数组
查看完整描述

2 回答

?
炎炎设计

TA贡献1808条经验 获得超4个赞

道理的解释,完整的代码和输出,以及个人的建议,全都写在帖子里了:

【问题解答】建议:处理html时复杂的需求,建议使用专门的库比如BeautifulSoup去处理而不要用正则


查看完整回答
反对 回复 2018-07-19
?
侃侃尔雅

TA贡献1801条经验 获得超15个赞

<divclass="lib-cat"><h3>分类索引</h3><divclass="list"& gt;<ul><li><ahref="(.*?)">电影</a></li& gt;<li><ahref="(.*?)">电视剧</a></li><li& gt;<ahref="(.*?)">综艺</a></li></ul>< /div> 

然后调用   正则表达式.findall(字符串) 
或者          正则表达式.search(字符串).groups() 

查看完整回答
反对 回复 2018-07-19
?
吃鸡游戏

TA贡献1829条经验 获得超7个赞

<divclass="lib-cat"><h3>分类索引</h3><divclass="list"& amp; gt;<ul><li>(<ahref=".*?">电影</a>)</li& gt;<li>(<ahref=".*?">电视剧</a>)</li><li& gt;(<ahref=".*?">综艺</a>)</li></ul>< /div> 

想要匹配哪一部分,就把那部分用括号框住,其中确定的文本不需要进行改动,不确定的文本用正则去表示就行了。 
上面的网址想精确点可以写成/\w+/\w+,电影、电视剧、综艺可以写成.*?或者.{2,3}。对于一般的的文本,几乎怎样匹配都不会有错,除非有人想为难你。 

查看完整回答
反对 回复 2018-07-19
  • 2 回答
  • 0 关注
  • 246 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信