正则匹配不到,re未定义
正则匹配不到,re未定义
正则匹配不到,re未定义
2017-11-30
re是一个模块,使用前先导入。写在前面:
from bs4 import BeautifulSoup #引入正则表达模块 import re import urllib.request url = urllib.request.urlopen('http://www.baidu.com') print(url.getcode()) html_doc = url.read() print(str(html_doc,'utf-8')) #搜索到的文档命名为html_doc #创建对象 soup = BeautifulSoup(html_doc, 'html.parser') print('获取所有链接') links = soup.find_all('a') for link in links: print(link.name, link['href'], link.get_text()) print('获取特定链接') link_node = soup.find('a', href='http://xueshu.baidu.com') print(link_node.name, link_node['href'], link_node.get_text()) print('正则匹配') link_node1 = soup.find('a', href=re.compile(r'baidu') print(link_node1.name, link_node1['href'], link_node1.get_text()) print('获取p段落文字') #获取p段落文字,指定class为title,输出文字。区分属性class,在其后加_。 p_node = soup.find('div', class_='ftCon-Wrapper') print(p_node.name, p_node.get_text())
举报