我将在索引方法之前和压缩方法之后存储TB级的信息。
我应该使用排序文件等手动编写二进制树数据库,还是使用诸如MongoDB甚至MySQL之类的文件?
我担心MySQL和其他数据库等事物的每条记录的(空间)成本。我也知道有些数据库甚至允许压缩,但是它们转换为只读表。这些表/记录需要经常访问并用新数据覆盖。我认为,如果我要用C++编写代码,则可以将每条记录的空间成本降至最低。
我该怎么办?
最佳答案
如今,有一些新的非关系型数据库变得越来越流行,它们专门用于管理大规模数据。
checkout Hadoop或Cassandra,它们都在Apache Project中。