假设我有一个网站,点击率很高。我需要将点击数据存储在某个数据库中,以便用于报告和监视目的。点击数据将包含以下信息:谁将用户引向本网站、用户来自何处、他们何时到达等。
有没有一种方法来存储和分析这些数据,比如每隔10分钟一次,这样你就可以大致了解网站每10分钟的运行情况。哪种类型的数据库最适合这种用途,哪种分析工具可以从这些数据中快速生成有意义的信息。我正在考虑的一种分析方法是使用map reduce的一些变体来运行对这些数据的查询。

最佳答案

虽然我还没试过,但看来很有前途。
引用:
opentsdb是一个分布式的、可伸缩的
写入时间序列数据库(TSDB)
HBase的顶端。opentsdb已写入
满足一个共同的需求:存储,索引
并提供从
计算机系统(网络设备,
操作系统、应用程序)
大规模,使这些数据更容易
容易接近和抓取。

关于database - 几乎实时存储和导出点击流数据的最佳方法是什么,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/5585660/

10-15 22:20
查看更多