我需要使用Perl从文本块中提取名称(包括不常用的名称)。我已经研究过用于提取名称的this模块,但是它只能追溯到1990年,在美国排名前1000位。我需要一些更全面的信息。

我已经考虑过使用社会保障指数来建立一个数据库进行比较,但是这看起来非常繁琐且需要大量处理。有没有一种方法可以使用另一种方法从Perl中提取名称?

要解析的文本示例:


LADNIER路易斯·安东尼·拉德尼尔(Louiie)现年48岁,来自阿拉巴马州莫比尔,于2012年11月16日星期五去世。路易丝于1964年1月9日出生于阿拉巴马州莫比尔。他是John E. Ladnier,Sr.和Gloria Bosarge Ladnier的儿子。他毕业于McGill-Toolen高中,并就读于南阿拉巴马大学。他一直被雇用,直到他在Bayou La Batre警察局担任通信主管时才退休。他的父亲约翰去世。他的母亲格洛丽亚(Gloria),侄子多米尼克·拉德尼尔(Do​​minic Ladnier)和克里斯蒂安·卢比奥(Christian Rubio)幸存下来,他深爱并帮助自己成长为儿子,姐妹,玛莉·拉德尼尔(Marj Ladnier)和摩根·高迪(Julian),哥哥埃迪·拉德尼尔(Eddie Ladnier)[辛迪]和侄子杰米(Jamie),乔伊,埃迪,威尔,本和侄女,安娜和伊丽莎白。纪念仪式将于周三下午1点在莫比尔的圣多米尼克天主教堂举行。宁静Fun仪馆负责安排。代替鲜花的纪念馆可以寄给St. Dominic学校,地址是Burma Road Mobile 4160,AL 36693,克里斯蒂安·卢比奥的教育基金; McGill-Toolen高中,Old Shell Road Mobile地址,AL 36604,Dominic Ladnier的教育基金。家人感谢这段时间的所有祈祷和支持。路易(Louie)是我们所有人的一块岩石,这是一种喜悦。

最佳答案

由于英语的性质,没有确定的可行方法。您或者需要(模糊)比较的列表,或者必须解决明显的精度损失。

07-28 12:05