几年前,我读到一种非常轻量级的文本压缩算法,但现在找不到引用或记住它的名称。
它使用了每对连续字符之间的差异。例如,由于小写字母预测下一个字符也将是小写字母,因此差异往往很小。 (在减去之前,它可能已经丢掉了前一个字符的低位;我不记得了。)立即降低复杂性。而且它是Unicode友好的。
当然,有一些麻烦,还有产生比特流的细节,但是它非常轻巧,适合嵌入式系统。没有庞大的字典来存储。我很确定我看到的摘要已在Wikipedia上,但我什么也找不到。
我记得它是Google发明的,但不是Snappy。
最佳答案
我认为您正在讨论的是BOCU,Binary-Ordered Compression for Unicode或其前任/后任之一。特别是,
关于algorithm - 此文本压缩方案的名称是什么?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/22411679/