我有很多包含不同拼写形式的文本的字符串。我通过搜索关键字来标记这些字符串,如果找到了关键字,则对该关键字使用关联的文本。

假设搜索字符串可以包含文本“schw。”,“schwa”。和“schwarz”。我有三个关键字都可以解析为文本“schwarz”。

现在,我正在寻找一种无需查找字符串即可查找所有关键字的有效方法。每个关键字都包含(keywords)。

样本数据:

H-Fuss ahorn 15 cm/SH48cm
Metall-Fuss chrom 9 cm/SH42cm
Metall-Kufe alufbg.12 cm/SH45c
Metall-Kufe verchr.12 cm/SH45c
Metall-Zylind.aluf.12cm/SH45cm
Kufe alufarbig
Metall-Zylinder hoch alufarbig
Kunststoffgl.schw. - hoch
Kunststoffgl.schw. - Standard
Kunststoffgleiter - schwarz für Sitzhoehe 42 cm

示例关键字(键,值):
h-fuss, Holz
ahorn, Ahorn
metall, Metall
chrom, Chrom
verchr, Chrom
alum, Aluminium
aluf, Aluminium
kufe, Kufe
zylind, Zylinder
hoch, Hoch
kunststoffgl, Gleiter
gleiter, Gleiter
schwarz, Schwarz
schw., Schwarz

样本结果:
Holz, Ahorn
Metall, Chrom
Metall, Kufe, Aluminium
Metall, Kufe, Chrom
Metall, Zylinder, Aluminium
Kufe, Aluminium
Metall, Zylinder, Hoch, Aluminium
Gleiter, Schwarz, Hoch
Gleiter, Schwarz
Gleiter, Schwarz

最佳答案

这似乎适合“Algorithms using finite set of patterns

09-11 17:47