追逐影子的人,自己就是影子。 ——荷马

达达最近迷上了文学。

她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。

但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,达达想通过一种编码方式使得它变得短一些。

一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wiwi。

达达想要用 k 进制串 sisi 来替换第 i 种单词,使得其满足如下要求:

对于任意的 1≤i,j≤n,i≠j,都有:sisi 不是 sjsj 的前缀。

现在达达想要知道,如何选择 sisi,才能使替换以后得到的新的《荷马史诗》长度最小。

在确保总长度最小的情况下,达达还想知道最长的 sisi 的最短长度是多少?

一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。

字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。

其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。

输入格式

输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。

第2~n+1 行:第 i+1 行包含 1 个非负整数 wiwi,表示第 i 种单词的出现次数。

输出格式

输出文件包括 2 行。

第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。

第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 sisi 的最短长度。

数据范围

2≤n≤1000002≤n≤100000,
2≤k≤92≤k≤9

输入样例:

4 2
1
1
2
2

输出样例:

12
2

算法:哈夫曼编码 + k叉哈夫曼树

#include <iostream>
#include <cstdio>
#include <queue> using namespace std; typedef long long ll; struct node {
ll val, deep;
friend bool operator < (node a, node b) { //优先队列重载时当满足下列写的条件时,队列就会按 < 排序
if(a.val == b.val) {
return a.deep > b.deep;
}
return a.val > b.val;
};
}; priority_queue<node> q; int main() {
int n, k;
scanf("%d %d", &n, &k);
for(int i = ; i <= n; i++) {
ll x;
scanf("%lld", &x);
q.push((node){x, });
}
while((q.size() - ) % (k - ) != ) { //假设k叉哈夫曼树每层都有k-1个数(不包括那个合成的点)
//那么,现在我们要构建一个满k叉哈夫曼树
//因为最后一层必定有k个数,所以就把总量减去1即可
//所以可以等到 (n - 1) % (k - 1) == 0 的性质
q.push((node){, });
}
ll ans = ;
while(q.size() > ) {
ll sum = ;
ll ma = ;
for(int i = ; i < k; i++) {
node t = q.top();
q.pop();
sum += t.val;
ma = max(ma, t.deep);
}
ans += sum;
q.push((node){sum, ma + });
}
printf("%lld\n%lld\n", ans, q.top().deep);
return ;
}
05-08 14:59