为了账号安全,请及时绑定邮箱和手机立即绑定

News Scraper 总是得到第二篇最新文章而不是最新文章

News Scraper 总是得到第二篇最新文章而不是最新文章

慕尼黑5688855 2022-10-25 09:43:33
我制作了一个新闻抓取工具,它获取名为“Phoronix”的网站的 RSS 提要并将其保存在文本文件中。但由于某种原因,它获得了第二篇最新文章而不是最新文章。这是代码:import feedparserimport timedef Log():    f = open("Logs/phoronixdb.txt", "a")    f.write("\n")    f.write("\n" + entry.published)    f.write("\n")    f.write("\n" + entry.title)    f.write("\n")    f.write("\n" + entry.summary)    f.write("\n")    f.write("\n" + entry.link)    f.close()def CheckDate():    f2 = open("db/phoronixlastdate.txt", "r")    date = f2.read()    if date == entry.published:        f2.close()    else:        Log()        f2.close()        f2 = open("db/phoronixlastdate.txt", "w")        f2.write(entry.published)        f2.close()while True:    NewsFeed = feedparser.parse("https://www.phoronix.com/rss.php")    entry = NewsFeed.entries[1]    CheckDate()    time.sleep(5)
查看完整描述

1 回答

?
墨色风雨

TA贡献1853条经验 获得超6个赞

我的猜测是这个

entry = NewsFeed.entries[1]

应该

entry = NewsFeed.entries[0]

这是因为我相信这些条目将文章列表作为数组返回,其中起始索引(0)对应于第一篇文章,依此类推。


查看完整回答
反对 回复 2022-10-25
  • 1 回答
  • 0 关注
  • 137 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号