为了账号安全,请及时绑定邮箱和手机立即绑定

Python算法:如何解决回文索引问题

译文链接:http://www.codeceo.com/article/python-anagram-indices.html
英文原文:How to Solve the Anagram Indices Problem
翻译作者:码农网 – 小峰


给定一个单词word和一个字符串S,找到S中的所有起始索引——word的回文。

例如,假设word是“ab”,并且S是“abxaba”,则返回0,3和4。

蛮力破解

对于这个问题野蛮的解决方案是遍历S中每个单词大小的窗口并检查它们是否是回文,如下所示:

from collections import Counterdef is_anagram(s1, s2):
    return Counter(s1) == Counter(s2)def anagram_indices(word, s):
    result = []    for i in range(len(s) - len(word) + 1):
        window = s[i:i + len(word)]        if is_anagram(window, word):
            result.append(i)    return result

这将花费O(|W| * |S|)时间。有没有更快的方法呢?

试试哈希

解决这个问题可以使用的一种方法是Rabin-Karp算法。基本思想是我们可以对目标word做一个基于频率的散列,并检查s下的任何窗口是否散列为相同的值。也就是说,散列将是每个字符和其频率的char * prime_num ** char_freq之和。如果word和窗口的散列匹配,则我们可以对两个字符串手动加上== 。因为预计冲突很少,所以时间将是O(S)。但是,解决这个问题有一个更简单的方法:

计数差异

请注意,沿着窗口移动意味着当实际只有一小部分更新的时候,重新计算整个窗口的频率计数。这种见解引导我们采取以下策略:

  • 制作目标单词的频率字典

  • 当我们沿着字符串前进时,持续比较差异

  • 当字典为空时,窗口和单词匹配

我们通过增加窗口中的新字符并删除旧的字符来区分我们的频率字典。

class FrequencyDict:
    def __init__(self, s):
        self.d = {}        for char in s:
            self.increment(char)    def _create_if_not_exists(self, char):
        if char not in self.d:
            self.d[char] = 0

    def _del_if_zero(self, char):
        if self.d[char] == 0:            del self.d[char]    def is_empty(self):
        return not self.d    def decrement(self, char):
        self._create_if_not_exists(char)
        self.d[char] -= 1
        self._del_if_zero(char)    def increment(self, char):
        self._create_if_not_exists(char)
        self.d[char] += 1
        self._del_if_zero(char)def anagram_indices(word, s):
    result = []

    freq = FrequencyDict(word)    for char in s[:len(word)]:
        freq.decrement(char)    if freq.is_empty():
        result.append(0)    for i in range(len(word), len(s)):
        start_char, end_char = s[i - len(word)], s[i]
        freq.increment(start_char)
        freq.decrement(end_char)        if freq.is_empty():
            beginning_index = i - len(word) + 1
            result.append(beginning_index)    return result

这应该在O(S)时间运行。


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消