我正在尝试对Python中的字符串进行比较。我的字符串包含标题,可以用多种不同的方式来组织标题:

'Title'
'Title: Subtitle'
'Title - Subtitle'
'Title, Subtitle'
'Title Subtitle'

是否可以在Python中进行相似性比较,以便可以确定match('Title: Subtitle', 'Title - Subtitle') = True? (或者它将被构造)

基本上,我试图确定它们是否具有相同的标题,即使拆分方式不同。
if 'Title: Subtitle' == 'Title - Subtitle':
    match = 'True'
else:
    match = 'False'

还有一些可能存储为The Title: The SubtitleTitle, The: Subtitle, The的文件,尽管我认为这可能会增加一些复杂性,我可以通过重构字符串来解决这个问题。

最佳答案

您想要做的事情已经在jellyfish包中很好地实现了。

>>> import jellyfish
>>> jellyfish.levenshtein_distance('jellyfish', 'smellyfish')
2

关于python - Python中的字符串相似性,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/36252845/

10-16 04:36