为了账号安全,请及时绑定邮箱和手机立即绑定

计算列表中的单词出现在字符串中的频率

计算列表中的单词出现在字符串中的频率

慕妹3146593 2021-07-16 18:01:03
我有一个预定义的单词列表;例如:wordlist = [["one"],["two"],["three"]]我有一个很大的 .txt 文件语料库,也作为列表导入到 python 中,例如:corpus = ["my friend has one potato","i have two bananas and three apples","my dad has three apples"] 我想要一个公式,它逐行遍历语料库,并告诉我每行包含的单词表中的单词数量;即,示例性输出将是:121我不需要区分单词表中的单词。但是,我希望这是一个公式,以便我可以轻松地将它应用于不同的单词列表或语料库。我还没有在 SO 或其他地方找到答案。我尝试过的是:wordcount_total=list()for i in range(len(corpus)):    row=corpus[i]    wordcount_row=sum(1 for word in row.split() if word in wordlist)    wordcount_total.append(wordcount_row)但是,这给了我:000非常感谢任何愿意提供帮助的人!
查看完整描述

3 回答

  • 3 回答
  • 0 关注
  • 178 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信