Freebuf-Spider
一个抓取freebuf所有栏目的文章的爬虫,以离线网页形式展现,上传了一些爬取好的结果
程序运行方式
python freebuf.py
输入文件名:输入要生成的html文件的文件名
输入栏目网址:freebuf文章分成了很多栏目,在分类阅读里面可以获取每个栏目的网址
该栏目总共有多少页:在栏目网址后面加上 /page/页数
http://www.freebuf.com/sectool -->http://www.freebuf.com/sectool/page/100
如果返回是
说明这个栏目没有这么多页,写程序的二分法不用我教吧,用这个方法可以快速得出总页数,然后填上即可
需要模块
import requests import re import urllib
输出结果
暂时爬取了三个栏目放在这里,大家可以看下效果,自己可以动手爬其他的
终端安全
可以看到freebuf终端安全的文章从建站到现在全部在这里了
安全工具合集
下载
各位给个star吧('')
作者:hfyhfyfhy
链接:https://www.jianshu.com/p/36e88702853b
点击查看更多内容
为 TA 点赞
评论
共同学习,写下你的评论
评论加载中...
作者其他优质文章
正在加载中
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦




