正则匹配不到,re未定义

正则匹配不到,re未定义

正则匹配不到,re未定义
2017-11-30
re是一个模块,使用前先导入。写在前面:
from bs4 import BeautifulSoup
#引入正则表达模块
import re
import urllib.request
url = urllib.request.urlopen('http://www.baidu.com')
print(url.getcode())
html_doc = url.read()
print(str(html_doc,'utf-8'))
#搜索到的文档命名为html_doc
#创建对象
soup = BeautifulSoup(html_doc, 'html.parser')
print('获取所有链接')
links = soup.find_all('a')
for link in links:
print(link.name, link['href'], link.get_text())
print('获取特定链接')
link_node = soup.find('a', href='http://xueshu.baidu.com')
print(link_node.name, link_node['href'], link_node.get_text())
print('正则匹配')
link_node1 = soup.find('a', href=re.compile(r'baidu')
print(link_node1.name, link_node1['href'], link_node1.get_text())
print('获取p段落文字')
#获取p段落文字,指定class为title,输出文字。区分属性class,在其后加_。
p_node = soup.find('div', class_='ftCon-Wrapper')
print(p_node.name, p_node.get_text())
举报