为了账号安全,请及时绑定邮箱和手机立即绑定

python正则表达式

难度初级
时长 1小时29分
学习人数
综合评分9.40
210人评价 查看评价
9.7 内容实用
9.4 简洁易懂
9.1 逻辑清晰
  • # coding:utf-8 import re pa = re.compile(r'imooc') # 创建匹配规则 ma = pa.match('imoocajijij') # 匹配以匹配规则开头的字符串 print ma.group() # 返回匹配到的内容 print ma.string # 返回需要匹配的字符串 print ma.span() # 返回匹配后字符串的位置 print ma.re # 返回匹配的实例
    查看全部
  • import re # 调入正则表达式包re str1 = 'iM python' # 创建字符串 #print(str1.find('im')) #print(str1.startswith('1')) ch = re.compile(r'im',re.I) # 生成规则 ma = ch.match(str1) # 匹配目标 rece = ma.group() # 保存目标 print (rece) # 打印目标
    查看全部
  • 抓取网页上的图片 1.获取网页,打开网页 url (实际是向网站发出请求) 2.将获取的 html 文件读到本地中 3.将文件写入本地文件
    查看全部
  • 爬取网站图片过程: import urllib2 //导入urllib2包 req=urllib2.urlopen('http://www.XXXX.com') //对网页发出请求 buf=req.read() //将网页内容读取到buf缓存中 import re urllist = re.findall(r'http:.+\.jpg',buf) //获取图片地址列表 i=0 for url in urllist: f=open(str(i)+'.jpg','wb') //创建一个文件,命名为{str(i).jpg} ‘w’:采用写入方式,若无该文件则创建它 req = urllib2.urlopen(url) //请求该地址内容 buf = req.read() //读取请求信息 f.write(buf) //将buf内容写到文件f中 i+=1
    查看全部
  • . 匹配任意一个字符。 [abc] 匹配中括号内的任意一个字符 /d /D 匹配任意一个数字 匹配任意一个非数字 /s /S 匹配一个空格 匹配任意一个非空格 /w /W 匹配一个单词型(字母和数字) /W匹配一个非单词型
    查看全部
  • 1、在文本中找到以imooc开头的语句: f=open("imooc.txt") for line in f: if line.startswith("imooc"): print line 或者构造成一个函数: def find_start_imooc(fname) f=open(fname) for line in f: if line.startswith("imooc"): print line find_start_imooc("imooc.txt")#调用该函数 2、找到imooc开头和结尾的语句。注意结尾要用切片。 def find_in_imooc(fname) f=open(fname) for line in f: if line.startswith("imooc") and line[:-1].endswith("imooc"): print line find_in_imooc("imooc.txt") 3、匹配一个下划线和字母开头的变量名 a="_value1" a and (a[0]=="_"or"a"<=a[0]<="z")#匹配 4、正则表达式概念 1.使用单个字符串来描述匹配一系列符合某个句法规则的字符串 2.是对字符串操作的一种逻辑公式 3.应用场景:处理文本和数据 4.正则表达式过程:依次拿出表达式和文本中的字符比较,如果每一个字符都能匹配,则匹配成功;否则匹配失效。
    查看全部
    1 采集 收起 来源:正则简介

    2018-03-22

  • 参数repl: 如果是字符串的时候可直接进行替换。 如果函数的话,sub()会先匹配string,然后把匹配到的内容返回给repl,然后由repl函数接收,并在函数中处理接收到的数据。
    查看全部
  • 1.import re #导入re模块 2.生成pattern对象:pa = re.compile(r'imooc') #匹配的字符 3.生成match对象:ma = pa.match('imooc.com') #被匹配的字符 4.ma.group() ==>imooc #返回匹配的字符 5.ma.span() ==>(0,5) #被匹配字符串所在索引位置 6.ma.string() ==>'imooc.com' #返回被匹配字符串 7.ma.re ==>re.compile(r'imooc') #返回实例
    查看全部
  • #[A-Z][a-z]* Adasdas * = 0到无穷大 ma = re.match(r'[A-Z][a-z]*','Afsdsdf') # [_a-zA-z]+[_\w]* + = 1到无穷大 ma = re.match(r'[_a-zA-z]+[_\w]*','_ht11') # [1-9]?[0-9] ? = 0到1 ma = re.match(r'[1-9]?[0-9]','87') # {m}/{m,n} = m次或者m到n次 ma = re.match(r'[a-zA-Z0-9]{6,10}@[/w]*.com','760799578@QQ.COM') # *?或者+?或者??非贪婪,见好就收(上面的加?) ma = re.match(r'[0-9][a-z]*?','lbc')
    查看全部
  • 除了简单地判断是否匹配之外,正则表达式还有提取子串的强大功能。用()表示的就是要提取的分组(Group)。 如果正则表达式中定义了组,就可以在Match对象上用group()方法提取出子串来。 注意到group(0)永远是原始字符串,group(1)、group(2)……表示第1、2、……个子串。
    查看全部
  • >>> import re >>> import urllib2 >>> req =urllib2.urlopen('http://www.mi.com/') >>> buf=req.read() >>> listurl=re.findall(r'src=.+\.jpg',buf) >>> listurl 终端下
    查看全部
  • Python 3.x 版本这么输入: In [1]: import re In [2]: import urllib.request In [3]: req = urllib.request.urlopen('http://www.imooc.com/course/list') In [4]: buf = req.read() In [5]: buf = buf.decode('utf-8') In [6]: listurl = re.findall(r'src=.+\.jpg', buf)
    查看全部
  • 规则4
    查看全部
  • 规则3
    查看全部
  • re.match(pattern,str)用来匹配 re.group()表示匹配到的内容
    查看全部

举报

0/150
提交
取消
课程须知
本课程是Python中级课程 1、本课程在linux讲解,最好有linux开发环境 1、熟练掌握Python开发语言基础语法
老师告诉你能学到什么?
1.正则表达式基本语法 2.使用re模块处理文本

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!