已解决430363个问题，去搜搜看，总会有你想问的

爬虫爬取网页后，如何保存网页？

首页猿问爬虫爬取网页后，如何保存网页？

爬虫爬取网页后，如何保存网页？

爬虫

犯罪嫌疑人X 2018-10-03 18:15:27

爬虫从 Internet 中爬取众多的网页作为原始网页库存储于本地，然后网页分析器抽取网页中的主题内容交给分词器进行分词，得到的结果用索引器建立正排和倒排索引，这样就得到了索引数据库，用户查询时，在通过分词器切割输入的查询词组并通过检索器在索引数据库中进行查询，得到的结果返回给用户。请问这里原始网页库是该怎么实现，是直接存到数据库里吗？还是什么形式？如果是存到数据库里，应该有哪些字段？

查看完整描述