我制作了一个新闻抓取工具,它获取名为“Phoronix”的网站的 RSS 提要并将其保存在文本文件中。但由于某种原因,它获得了第二篇最新文章而不是最新文章。这是代码:import feedparserimport timedef Log(): f = open("Logs/phoronixdb.txt", "a") f.write("\n") f.write("\n" + entry.published) f.write("\n") f.write("\n" + entry.title) f.write("\n") f.write("\n" + entry.summary) f.write("\n") f.write("\n" + entry.link) f.close()def CheckDate(): f2 = open("db/phoronixlastdate.txt", "r") date = f2.read() if date == entry.published: f2.close() else: Log() f2.close() f2 = open("db/phoronixlastdate.txt", "w") f2.write(entry.published) f2.close()while True: NewsFeed = feedparser.parse("https://www.phoronix.com/rss.php") entry = NewsFeed.entries[1] CheckDate() time.sleep(5)
1 回答

墨色风雨
TA贡献1853条经验 获得超6个赞
我的猜测是这个
entry = NewsFeed.entries[1]
应该
entry = NewsFeed.entries[0]
这是因为我相信这些条目将文章列表作为数组返回,其中起始索引(0)对应于第一篇文章,依此类推。
添加回答
举报
0/150
提交
取消