我有一堆描述疾病的文字文件。这些文件在大多数情况下都很短,通常只包含一个句子。这里给出一个例子:


  原发性肺动脉高压是一种进行性疾病,其中广泛阻塞最小的肺动脉会导致肺血管阻力增加,进而导致右心室衰竭。


我需要的是一种工具,可以找到句子中的所有疾病术语(例如本例中的“肺动脉高压”)并将其映射到受控的词汇表,例如MeSH

预先感谢您的回答!

最佳答案

这是两个专门用于医疗文档分析的管道:


Apache cTAKES
NLM's MetaMap


两者都使用统一的医学语言系统UMLS,因此需要您拥有(免费)许可证。两者都是Java,或多或少易于设置。

09-27 09:02