Python算法：如何解决回文索引问题

时间：2014-06-29

例如，假设word是ab，并且S是abxaba，则返回0,3和4

友情提示：本文共有 1883 个字，阅读大概需要 4 分钟。

给定一个单词word和一个字符串S，找到S中的所有起始索引——word的回文。

例如，假设word是“ab”，并且S是“abxaba”，则返回0,3和4。

蛮力破解

对于这个问题野蛮的解决方案是遍历S中每个单词大小的窗口并检查它们是否是回文，如下所示：

from collections import Counterdef is_anagram(s1, s2):return Counter(s1) == Counter(s2)def anagram_indices(word, s): result = [] for i in range(len(s) - len(word) + 1): window = s[i:i + len(word)] if is_anagram(window, word): result.append(i) return result

这将花费O(|W| * |S|)时间。有没有更快的方法呢？

试试哈希

解决这个问题可以使用的一种方法是Rabin-Karp算法。基本思想是我们可以对目标word做一个基于频率的散列，并检查s下的任何窗口是否散列为相同的值。也就是说，散列将是每个字符和其频率的char * prime_num ** char_freq之和。如果word和窗口的散列匹配，则我们可以对两个字符串手动加上== 。因为预计冲突很少，所以时间将是O(S)。但是，解决这个问题有一个更简单的方法：

计数差异

请注意，沿着窗口移动意味着当实际只有一小部分更新的时候，重新计算整个窗口的频率计数。这种见解引导我们采取以下策略：

制作目标单词的频率字典当我们沿着字符串前进时，持续比较差异当字典为空时，窗口和单词匹配

我们通过增加窗口中的新字符并删除旧的字符来区分我们的频率字典。

class FrequencyDict:def __init__(self, s): self.d = {} for char in s: self.increment(char) def _create_if_not_exists(self, char): if char not in self.d: self.d[char] = 0 def _del_if_zero(self, char): if self.d[char] == 0: del self.d[char] def is_empty(self): return not self.d def decrement(self, char): self._create_if_not_exists(char) self.d[char] -= 1 self._del_if_zero(char) def increment(self, char): self._create_if_not_exists(char) self.d[char] += 1 self._del_if_zero(char)def anagram_indices(word, s): result = [] freq = FrequencyDict(word) for char in s[:len(word)]: freq.decrement(char) if freq.is_empty(): result.append(0) for i in range(len(word), len(s)): start_char, end_char = s[i - len(word)], s[i] freq.increment(start_char) freq.decrement(end_char) if freq.is_empty(): beginning_index = i - len(word) + 1 result.append(beginning_index) return result

这应该在O(S)时间运行。

欢迎继续探索其他有趣的编程问题。

本文如果对你有帮助，请点赞收藏《Python算法：如何解决回文索引问题》，同时在此感谢原作者。

Python 算法回文索引问题

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。