是否可以将三元组存储的大小与 RDBMS 的粗略等价联系起来?或者这会根据存储的数据类型变化太大(在我的例子中是 CMS 的文本内容)

我想弄清楚 800MB 的数据库与 17 亿的三元组存储相比如何。我完全准备好被告知这是一个愚蠢的问题。

最佳答案

这是一个很难回答的问题,但并不愚蠢。

从广义上讲,您可以从表格大小转换为三重计数,例如:

triples = columns - 1 * rows

这有点过度概括,但它应该给你一些想法,例如如果你有一张像:
prikey val1   val2
a      1      2
b      3      4
c      5      6

那将是 6 个三元组,如果您熟悉 NTriples 语法,则三元组将是:
<a> <val1> 1 .
<a> <val2> 2 .
<b> <val1> 3 .
<b> <val2> 4 .
<c> <val1> 5 .
<c> <val2> 6 .

在更复杂的情况下(如复合 pirmary 键),它可能更多或更少,但它应该给你一些想法。

关于database - 十亿个三元组有多大?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/4146583/

10-13 03:50