И опять про дистанцию Левенштейна! Русский язык, как известно, богат и могуч, и всем известные матюки можно склонять самыми разными способами. (Потому шо синтетический язык[1].) Хотя мне оно не надо, но дарю идею пытливым умам. Возможно, при помощи дистанции Л. можно, при надобности, детектить (искаженные, свеже-придуманные, мемные) матюки -- измерять кол-во редакций между известными матюками и всеми словами во входящем тексте. Малая дистанция -- бОльшая вероятность, что это матюк. [1] https://ru.wikipedia.org/wiki/%D0%A1%D0%B8%D0%BD%D1%82%D0%B5%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D1%8F%D0%B7%D1%8B%D0%BA