我正在为我们的网站(一个像样的网站,每天获得数百万次浏览量)构建一些报告内容,并且想知道那里是否有任何好的免费/开源数据仓库系统。

具体来说,我只在寻找可以存储数据的东西,我打算为其构建自定义的前端/ UI,以便显示我们关注的信息。但是,我不想为此建立定制的数据库,虽然我很确定SQL数据库在这里不能工作,但是我不确定确切使用什么。指向有用文章的任何指针也将不胜感激。

编辑:我应该提到-我简要介绍过的一个数据库是MongoDB。看起来可能可行,但是他们的“用例”特别提到数据仓库为“Less Well Suited”:http://www.mongodb.org/display/DOCS/Use+Cases。而且,它似乎并不专门针对数据仓库。

最佳答案

http://www.hypertable.org/可能是您正在寻找的东西(我将通过上面的描述在此进行介绍),以便通过标准化存储大量记录的数据。即访问者日志。

Hypertable基于Google的bigTable项目。
请参阅http://code.google.com/p/hypertable/wiki/PerformanceTestAOLQueryLog以获取基准

您失去了基于SQL的数据库的关系功能,但是却获得了很多性能。您可以轻松地使用hypertable每小时存储数百万行(可承受硬盘空间)。

希望能有所帮助

10-04 11:50
查看更多