我下载并使用了OpenIE4.1 jar文件(可从http://knowitall.github.io/openie/下载)来处理一些免费的文本文档,并产生了类似文本的三重态输出以及文本和置信度分数,例如,
The rail launchers are conceptually similar to the underslung SM-1
0.93 (The rail launchers; are; conceptually similar to the underslung SM-1)
我编写了一个Java解析器来提取可信度> = 0.85的OpenIE三元组,并且
需要知道将其转换为N-triplet(NT)的方式,格式看起来像。
不知道我是否需要熟悉要映射的本体。
最佳答案
经过与同事的讨论。这是创建N-Triplet(NT)的操作,详细的Java代码可以在另一个问题中找到:Use RDF API (Jena, OpenRDF or Protege) to convert OpenIE outputs
为文件中的每个不同的:subject创建一个空白节点标识符(称为node_s)
为文件中的每个不同的:object创建一个空白节点标识符(称为node_o)
为每个不同的谓词定义一个URI
创建这些三元组:
1. node_s rdf:type <http://mypage.org/vocab#Corpus>
2. node_s dc:title “The rail launchers”
3. node_s dc:source “Sample File”
4. node_s rdf:predicate <http://mypage.org/vocab#are>
5. node_o rdf:type <http://mypage.org/vocab#Corpus>
6. node_o dc:title “conceptually similar to the underslung SM-1”