如何使用python模块rdflib将一个简单的以制表符分隔的txt文件(包含标题主题、谓词、对象)转换为RDF n-triple格式?
最佳答案
不是很复杂。首先,一些必要的进口:
from StringIO import StringIO
from rdflib import Graph, URIRef
我在这里使用
StringIO
来避免创建文件。相反,我将列出一些内容和一个类似文件的对象,其中包含以下内容:contents = '''\
subject1\tpredicate1\tobject1
subject2\tpredicate2\tobject2'''
tabfile = StringIO(contents)
然后创建一个图表并将所有三个元素加载到其中:
graph = rdflib.Graph()
for line in tabfile:
triple = line.split() # triple is now a list of 3 strings
triple = (URIRef(t) for t in triple) # we have to wrap them in URIRef
graph.add(triple) # and add to the graph
现在,整个图都在内存中(当然,假设您有足够的内存)。现在可以打印:
print graph.serialize(format='nt')
# prints:
# <subject1> <predicate1> <object1> .
# <subject2> <predicate2> <object2> .