1. 位图概念

1. 面试题 给40亿个不重复的无符号整数,没排过序。给一个无符号整数,如何快速判断一个数是否在 这40亿个数中。【腾讯】

1. 利用map,set等容器存储遍历   2. 排序(O(NlogN)),利用二分查找: C++ 位图-LMLPHP

但是其有40亿个数据,而且是整型,最后估算下来,光是数据就占用了十六个G,何况还要用红黑树,哈希表这样的结构存储下来,这是不现实的。

3. 位图解决

数据是否在给定的整形数据中,结果是在或者不在,刚好是两种状态,那么可以使用一个二进制比特位来代表数据是否存在的信息,如果二进制比特位为1,代表存在,为0 代表不存在。比如:

C++ 位图-LMLPHP

所谓位图,就是用每一位来存放某种状态,适用于海量数据,数据无重复的场景。通常是用来判断某个数据存不存在的。

2.位图的使用

在STL库中,已经为我们提供了位图bitset
C++ 位图-LMLPHP
参数为一个非类型模板参数N,其代表位图中要开多少个比特位。

3.位图的实现

#include<iostream>
#include<bitset>
#include<vector>
using namespace std;
namespace lbk
{
	template<size_t N>
	class bitset
	{
	public:
		bitset()
		{
			_bit.resize(N / 32 + 1,0);
			_count = 0;
		}
		size_t size()
		{
			return N;
		}
		size_t count()
		{
			int bitCnttable[256] = {
				0, 1, 1, 2, 1, 2, 2, 3, 1, 2, 2, 3, 2, 3, 3, 4, 1, 2, 2, 3, 2, 3, 3, 4, 2,
				3, 3, 4, 3, 4, 4, 5, 1, 2, 2, 3, 2, 3, 3, 4, 2, 3, 3, 4, 3, 4, 4, 5, 2, 3,
				3, 4, 3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5, 6, 1, 2, 2, 3, 2, 3, 3, 4, 2, 3, 3,
				4, 3, 4, 4, 5, 2, 3, 3, 4, 3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5, 6, 2, 3, 3, 4,
				3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5, 6, 3, 4, 4, 5, 4, 5, 5, 6, 4, 5, 5, 6, 5,
				6, 6, 7, 1, 2, 2, 3, 2, 3, 3, 4, 2, 3, 3, 4, 3, 4, 4, 5, 2, 3, 3, 4, 3, 4,
				4, 5, 3, 4, 4, 5, 4, 5, 5, 6, 2, 3, 3, 4, 3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5,
				6, 3, 4, 4, 5, 4, 5, 5, 6, 4, 5, 5, 6, 5, 6, 6, 7, 2, 3, 3, 4, 3, 4, 4, 5,
				3, 4, 4, 5, 4, 5, 5, 6, 3, 4, 4, 5, 4, 5, 5, 6, 4, 5, 5, 6, 5, 6, 6, 7, 3,
				4, 4, 5, 4, 5, 5, 6, 4, 5, 5, 6, 5, 6, 6, 7, 4, 5, 5, 6, 5, 6, 6, 7, 5, 6,
				6, 7, 6, 7, 7, 8 };
			for (auto e : _bit)
			{
				for (int i = 0; i < 4; i++)
				{
					unsigned char c = e;
					_count += bitCnttable[c];
					e >>= 8;
				}
			}
			return _count;
		}
		bitset& set(size_t x)
		{
			int i = x / 32;
			int j = x % 32;
			_bit[i] |= (1 << j);
			return *this;
		}
		bitset& reset(size_t x)
		{
			int i = x / 32;
			int j = x % 32;
			_bit[i] &= (~(1 << j));
			return *this;
		}
		bool test(size_t x)
		{
			int i = x / 32;
			int j = x % 32;
			return _bit[i] & (1 << j);
		}
	private:
		vector<int> _bit;
		size_t _count;
	};
}
08-02 05:30