主要知识点:
- bucket与metric核心慨念
一、核心慨念
1、bucket:一个数据分组
比如有下面几条数据:
city name
北京
小李
北京
小王
上海
小张
上海
小丽
上海
小陈
基于city划分buckets(基于city进行分组)
划分出来两个bucket,一个是北京bucket,一个是上海bucket
- 北京bucket:包含了2个人,小李,小王
- 上海bucket:包含了3个人,小张,小丽,小陈
由此可以看出:按照某个字段进行bucket划分,那个字段的值相同的那些数据,就会被划分到同一个bucket中。这就是mysql的分组是一个慨念。
2、metric:对一个数据分组执行的统计
metric就是对一个bucket执行的某种聚合分析的操作。我们有了一堆bucket之后,就可以对每个bucket中的数据进行聚合分词了,比如说计算一个bucket内所有数据的数量,或者计算一个bucket
和mysql的sql语句比较
select count(*) from access_log group by user_id
- bucket:group by user_id --> 指那些user_id相同的数据,就会被划分到一个bucket中
- metric:count(*)。对每个user_id所分的bucket数据,进行聚合计算