我们有大量的数据,用户可能想要快速查看它们的窗口。他们可能希望查看一天,一周,一个月或任意开始和结束数据的数据窗口。实时对所有这些东西进行归类和汇总证明对我们来说是很痛苦的,因此我想到了在3D渲染中执行类似于Mipmaps的操作的想法。您最终将存储以各种不同的比例尺预先计算的相同数据,然后使用不同的比例尺对结果进行插值。因此,我已经知道商店一年,给定月份,给定星期和给定日期的数字,如果他们要求特定范围,我将使用各种比例尺快速求和,得出正确的数字。结果,但我不必重新处理整个数据集,我只检索四个或五个记录,然后添加或减去它们即可。

这是真实的模式吗?它有意义吗?在哪里我可以读到最好的方法,或者有更好的方法来处理像这样的大数据块,需要在不同的切片中进行查看?

看来这应该是一个众所周知且已解决的问题。例如,很多人都有股票投资组合,他们每天都需要做这种事情。我们的数据不是股票价格,但是想法是一样的。

最佳答案

好的,我搜索了又搜索了更多。 Andy Dent的链接使我开始将数据描述为“时间序列”,这对一些人有所帮助。然后我遇到了OLAP,意识到我在做的是在重新发明它。我知道这必须是一个众所周知的,已彻底解决的问题,我是对的。 OLAP就是这样。

您构建了一堆汇总表,这些汇总表沿特定维度(在这种情况下为时间)汇总数据,甚至可以获得Mondrian之类的工具,它将接受以另一种查询语言(即非SQL)编写的查询,以及一组事实表和汇总并决定如何最好地对这些表执行查询。

10-08 08:32
查看更多