幂次法则分布和高斯分布是两种广泛存在的数学分布。可以预测和统计相关数据。
pig中用其处理数据倾斜,实现负载均衡。
个体的规模和其名次之间存在着幂次方的反比关系,R(x)=ax(-b次方)
其中,x为规模(如:人口、成绩、营业额…),R(x)为其名次(第1名的规模最大),a为系数,b为幂次。当二边均取对数(log)时,公式成为log(R(x)) = log(a) - b˙log(x)。若以log(R(x))为X轴,log(x)为Y轴,其分布图呈直线,斜率为负。斜率之绝对值越小,代表规模差异越小。
许多的经验研究发现,诸如都市人口、网站规模、(英文)字汇出现频率、国民生产毛额…,均呈现幂次法则现象( www.isoc.org/inet2000/cdproceedings/2a/2a_2.htm )。其中,最有名的是Zipf's Law,其幂次为-1 ( linkage.rockefeller.edu/wli/zipf/
)。
幂次法则也是复杂系统(complex
systems)重要的「自组织」(self-organization)现象。复杂系统的六个特性:不存在总体生长控制规则、分散的个体互动、呈现阶层式结构、动态演化过程、不断出现新奇现象、不均衡状态。个体的非线性(方程式)互动关系所构成的复杂系统,却可能在总体面呈现简单的形式规则(自组织现象)。幂次法则便是其中一个很常见的现象。