我下载并使用了OpenIE4.1 jar文件(可从http://knowitall.github.io/openie/下载)来处理一些免费的文本文档,并产生了类似文本的三重态输出以及文本和置信度分数,例如,

The rail launchers  are conceptually similar to the underslung SM-1
0.93 (The rail launchers; are; conceptually similar to the underslung SM-1)


我编写了一个Java解析器来提取可信度> = 0.85的OpenIE三元组,并且
需要知道将其转换为N-triplet(NT)的方式,格式看起来像。

不知道我是否需要熟悉要映射的本体。

最佳答案

经过与同事的讨论。这是创建N-Triplet(NT)的操作,详细的Java代码可以在另一个问题中找到:Use RDF API (Jena, OpenRDF or Protege) to convert OpenIE outputs


为文件中的每个不同的:subject创建一个空白节点标识符(称为node_s)
为文件中的每个不同的:object创建一个空白节点标识符(称为node_o)
为每个不同的谓词定义一个URI
创建这些三元组:

1.  node_s              rdf:type                <http://mypage.org/vocab#Corpus>
2.  node_s              dc:title                 “The rail launchers”
3.  node_s              dc:source            “Sample File”
4.  node_s              rdf:predicate      <http://mypage.org/vocab#are>
5.  node_o              rdf:type                <http://mypage.org/vocab#Corpus>
6.  node_o              dc:title                 “conceptually similar to the underslung SM-1”

08-25 22:31