引入
已知一个数列,你需要进行下面两种操作:
将某一个数加上 xx (修改)
求出某区间每一个数的和 (查询)
如何解决这个问题呢?
如果直接使用数组来做,那么修改操作复杂度是 \(O(1)\) ,查询复杂度是 \(O(N)\).
而如果使用前缀和数组来做,那么修改操作复杂度是 \(O(N)\) ,查询复杂度是 \(O(1)\).
上面两种方法的总复杂度都是 \(O(N)\)
那么有没有更快的方法呢?有,树状数组便是一种解决方法,它的复杂度是 \(O(logN)\) (在后面我们会说明为什么)
原理
树状数组,是基于二进制的数位的特性的数据结构。所谓的特性指的是什么呢?简单地说就是可以逐位拆解出 \(1\) ,直到整个串被如此表示。
举个例子:给出一个二进制串 \(100101\) ,它可以被分解为 \(100000+100+1\) 。
这样便为求前缀和提供了一条道路:按照拆出来的数分块求前缀和。
比如说要求数组前 \(12\) 个元素的和,利用 \(12_{(10)}=1100_{(2)}=1000_{(2)}+100_{(2)}=8_{(10)}+4_{(10)}\) 。
先求出后 \(4\) 个元素的和(即 \(9-12\) ),再求出除了这 \(4\) 个元素之外后 \(8\) 个元素的和(即 \(1-8\) )再把它们加起来即可。
这样我们便解决了求前缀和(查询)操作。
讲到这里,我想引入这张图片帮助理解:(我们记 \(x\) 所对应的区间为 c[x]
)这张图完美地解释了 \(x\) 能够维护 \(lowbit(x)\) 个元素 ( \(lowbit(x)\) 指 \(x\) 在二进制下最后一个 \(1\) 以及它后面所有的 \(0\) 构成的二进制串所对应的数,比如说 \(lowbit(6)=lowbit(110_{(2)})=10_{(2)}=2\) )
下面来讲讲更新操作:
核心问题便是:一个数改变了,需要改变什么相关的区间?
答案是:改变维护的区间包括这个数的区间,还是举例来说,如果 a[9]
改变了,由上图可以看出,c[9]
,c[10]
,c[12]
( \(12\) 之后的不考虑 )均要改变。事实上,c[x]
上面的区间是c[x+lowbit(x)]
(比如 \(9_{(10)}=1001_{(2)}\) 于是 \(9\) 上面一层区间便是\(1001_{(2)}+lowbit(1001_{(2)})=1010_{(2)}=10_{(10)})\) 依次类推)。
这样我们便知道如何更新了。
代码实现
//修改 p指的是当前位置,k指的是加上k(如果tree[p]=k则是修改为k)
void modify(int p,int k){
for(;p<=n;p+=lowbit(p)) tree[p]+=k;
}
//查询
int query(int p){
int res=0;
for(;p;p-=lowbit(p)) res+=tree[p];
return res;
}
复杂度分析
结合代码,复杂度分析可以更便于理解:
以查询为例,复杂度无疑取决于那个for
循环会执行多少次。根据lowbit
的定义,
即使p
所对应的二进制串
都是 \(1\),也不过是循环 \(1\) 的个数次。
具体地说,\(N=111...111_{(2)}\)(有 \(x\) 个 \(1\) ),而 \(N\) 可以近似看成是 \(2^x\) ,故循环的次数为 \(x=logN\),
故对应的复杂度是 \(O(logN)\) 。
类似的,修改的操作亦然。