作者: 阮一峰日期: 2013年7月 4日上一次,我介绍了一些数论知识。有了这些知识,我们就可以看懂RSA算法。这是目前地球上最重要的加密算法。六、密钥生成的步骤我们通过一个例子,来理解RSA算法。假设爱丽丝要与鲍勃进行加密通信,她该怎么生成公钥和私钥呢?第一步,随机选择两个不相等的质数p和q。爱丽丝选择了61和53。(实际应用中,这两个质数越大,就越难破解。)第二步,计算p和q的乘积n。爱丽丝就把61和53相乘。n的长度就是密钥长度。3233写成二进制是110010100001,一共有12位,所以这个密钥就是12位。实际应用中,RSA密钥一般是1024位,重要场合则为2048位。第三步,计算n的欧拉函数φ(n)。根据公式:爱丽丝算出φ(3233)等于60×52,即3120。第四步,随机选择一个整数e,条件是1爱丽丝就在1到3120之间,随机选择了17。(实际应用中,常常选择65537。)第五步,计算e对于φ(n)的模反元素d。所谓"模反元素"就是指有一个整数d,可以使得ed被φ(n)除的余数为1。这个式子等价于于是,找到模反元素d,实质上就是对下面这个二元一次方程求解。已知 e=17, φ(n)=3120,这个方程可以用"扩展欧几里得算法"求解,此处省略具体过程。总之,爱丽丝算出一组整数解为 (x,y)=(2753,-15),即 d=2753。至此所有计算完成。第六步,将n和e封装成公钥,n和d封装成私钥。在爱丽丝的例子中,n=3233,e=17,d=2753,所以公钥就是 (3233,17),私钥就是(3233, 2753)。实际应用中,公钥和私钥的数据都采用ASN.1格式表达(实例)。七、RSA算法的可靠性回顾上面的密钥生成步骤,一共出现六个数字:这六个数字之中,公钥用到了两个(n和e),其余四个数字都是不公开的。其中最关键的是d,因为n和d组成了私钥,一旦d泄漏,就等于私钥泄漏。那么,有无可能在已知n和e的情况下,推导出d?结论:如果n可以被因数分解,d就可以算出,也就意味着私钥被破解。可是,大整数的因数分解,是一件非常困难的事情。目前,除了暴力破解,还没有发现别的有效方法。维基百科这样写道:举例来说,你可以对3233进行因数分解(61×53),但是你没法对下面这个整数进行因数分解。它等于这样两个质数的乘积:事实上,这大概是人类已经分解的最大整数(232个十进制位,768个二进制位)。比它更大的因数分解,还没有被报道过,因此目前被破解的最长RSA密钥就是768位。八、加密和解密有了公钥和密钥,就能进行加密和解密了。(1)加密要用公钥 (n,e)假设鲍勃要向爱丽丝发送加密信息m,他就要用爱丽丝的公钥 (n,e) 对m进行加密。这里需要注意,m必须是整数(字符串可以取ascii值或unicode值),且m必须小于n。所谓"加密",就是算出下式的c:爱丽丝的公钥是 (3233, 17),鲍勃的m假设是65,那么可以算出下面的等式:于是,c等于2790,鲍勃就把2790发给了爱丽丝。(2)解密要用私钥(n,d)爱丽丝拿到鲍勃发来的2790以后,就用自己的私钥(3233, 2753) 进行解密。可以证明,下面的等式一定成立:也就是说,c的d次方除以n的余数为m。现在,c等于2790,私钥是(3233, 2753),那么,爱丽丝算出因此,爱丽丝知道了鲍勃加密前的原文就是65。至此,"加密--解密"的整个过程全部完成。我们可以看到,如果不知道d,就没有办法从c求出m。而前面已经说过,要知道d就必须分解n,这是极难做到的,所以RSA算法保证了通信安全。你可能会问,公钥(n,e) 只能加密小于n的整数m,那么如果要加密大于n的整数,该怎么办?有两种解决方法:一种是把长信息分割成若干段短消息,每段分别加密;另一种是先选择一种"对称性加密算法"(比如DES),用这种算法的密钥加密信息,再用RSA公钥加密DES密钥。九、私钥解密的证明最后,我们来证明,为什么用私钥解密,一定可以正确地得到m。也就是证明下面这个式子:因为,根据加密规则于是,c可以写成下面的形式:将c代入要我们要证明的那个解密规则:它等同于求证由于所以将ed代入:接下来,分成两种情况证明上面这个式子。(1)m与n互质。根据欧拉定理,此时得到原式得到证明。(2)m与n不是互质关系。此时,由于n等于质数p和q的乘积,所以m必然等于kp或kq。以 m = kp为例,考虑到这时k与q必然互质,则根据欧拉定理,下面的式子成立:进一步得到即将它改写成下面的等式这时t必然能被p整除,即 t=t'p因为 m=kp,n=pq,所以原式得到证明。(完) 10-09 11:14