课程
                    
                        /后端开发
                        
                            /Python
                        
                        /Python最火爬虫框架Scrapy入门与实践

编码问题，现在是unicode，没法用xpath

请问老师及各位朋友，我现在抓取的网页，源代码是unicode，直接使用response.xpath是不能正确匹配的。

但是如果，我将response.text转码为utf-8后赋值给一个str变量，str是不能使用xpath的。

但是同时response.text又不能修改（即转码后给自身赋值）。

这种情况有什么好的办法嘛

手刻CPU

2020-02-03

源自：Python最火爬虫框架Scrapy入门与实践 2-7

关注问题我要回答

1145

操作

收起

1 回答

手刻CPU 提问者
2020-02-04

已解决，使用lxml的etree配合转码可以解决。

目前转码后发现，爬去的返回信息是JS和data，网页是动态生成的，这个怎么爬取呢

目标网页：

https://b2b.baidu.com/cc?q=%E4%BC%BA%E6%9C%8D%E9%A9%B1%E5%8A%A8%E5%99%A8&from=b2b_factory&srcid=5359&from_ver=v2&from_elem=title

0 回复有任何疑惑可以回复我~

收起回答

0/150

提交

取消

Python最火爬虫框架Scrapy入门与实践

参与学习 67422 人
解答问题 235 个

做为爬虫工程师Python Scrapy主流爬虫框架你必须要会！

进入课程

本课相似问答

3 回答Xpath问题

1 回答Xpath在解析的时候没问题，但是有的Xpath语句就爬不到东西怎么回事呢

2 回答爬到的类容中文显示unicode编码

1 回答老师用的xpath工具是什么？

1 回答有的xpath里面可以获得数据没有问题但是scrapy里面将xpath语句复制过来得到的[]

搜索更多本课相关问答

编码问题，现在是unicode，没法用xpath

我要回答关注问题

热搜

最近搜索清空

编码问题，现在是unicode，没法用xpath

1 回答

本课相似问答

编码问题，现在是unicode，没法用xpath