我正在尝试对Python中的字符串进行比较。我的字符串包含标题,可以用多种不同的方式来组织标题:
'Title'
'Title: Subtitle'
'Title - Subtitle'
'Title, Subtitle'
'Title Subtitle'
是否可以在Python中进行相似性比较,以便可以确定
match('Title: Subtitle', 'Title - Subtitle') = True
? (或者它将被构造)基本上,我试图确定它们是否具有相同的标题,即使拆分方式不同。
if 'Title: Subtitle' == 'Title - Subtitle':
match = 'True'
else:
match = 'False'
还有一些可能存储为
The Title: The Subtitle
或Title, The: Subtitle, The
的文件,尽管我认为这可能会增加一些复杂性,我可以通过重构字符串来解决这个问题。 最佳答案
您想要做的事情已经在jellyfish包中很好地实现了。
>>> import jellyfish
>>> jellyfish.levenshtein_distance('jellyfish', 'smellyfish')
2
关于python - Python中的字符串相似性,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/36252845/