浅谈古典密码
根据密码学的考纲和PPT,简单的归纳一下古典密码学的做法。一般来说都会作为大题考察,因为考察近现代密码用手算不是很现实……
代替密码是指先建立一个替换表,加密时将需要加密的明文依次通过查表,替换为相应的字符。明文字符被逐个替换后,生成无任何意义的字符串,即密文。代替密码的密钥就是其替换表。
根据密码算法加解密时使用替换表多少的不同,代替密码又可分为单表代替密码和多表代替密码。
- 单表代替密码:密码算法加解密时使用一个固定的替换表
- 多表代替密码:密码算法加解密时使用多个替换表
我们简单的把古典密码分为单标代替和多表代替来讨论。单表代替的重点是仿射密码,多表代替的重点是希尔密码。虽然古典密码相对比较简单,但还是推荐读者多动笔计算一下。
那么就开始吧。
单表代替
单表代替密码密钥量很小,不能抵抗穷尽搜索攻击。且没有将明文字母出现的概率掩藏起来,很容易受到统计分析的攻击。
单表代替密码主要介绍三种:
移位密码
移位密码非常简单,就是把明文对应的字符移动对应的位数即可得到密文,再移回来就可以得到明文。
加密变换:E={E:Z26→Z26,Ek(p)=p+k(mod26)∣p∈P,k∈K}
解密变换:D={D:Z26→Z26,Dk=c−k(mod26)∣c∈C,k∈K}
当移位密码的密钥k=3时,就是著名的凯撒密码。
此时:ceasar cipher→FDHVDU FLSKHU
使用密钥的单表代替加密
选用一个英文短语或者单词串作为密钥,去掉其中重复的字母得到一个无重复字母的字母串,然后将字母表中的其他字母依次写于此字母串之后,就可构造出一个字母代替表。
例题
给定密钥为:spectacular
明文:ABCDEFGHIJKLMNOPQRSTUVWXYZ
密文:spectaulrbdfghijkmnoqvwxyz
如果明文为China,则对应密文为elrhs
仿射密码
仿射密码是加强版的移位密码。移位密码的密钥空间只有26,但是仿射密码的密钥空间有312.虽然比移位密码更强大,但数据量仍然不大,在现代计算机面前通过爆破破解明文轻而易举。同时,没有隐藏
仿射密码是一种线性变换。仿射密码的明文空间和密文空间与移位密码相同,但密钥空间为K={(k1,k2)∣k1,k2∈Z26,gcd(k1,26)=1}。即需要两个密钥k1,k2;k1必须和26互素。否则会出现多个明文字母对应同一密文字母的情况。
对任意的p∈P,c∈C,k=(k1,k2)∈K,
定义加密变换为:c=Ek(p)=k1p+k2(mod26)
相应的解密变换为:p=Dk(c)=k−1(c−k2)(mod26)
其中k1k1−1=1(mod26),即k1−1为k1的逆元。
例题
设明文消息为China,密钥k=(k1,k2)=(7,3),用仿射密码对其进行加密,然后再进行解密。
利用扩展欧几里得算法求出k1−1=7−1=15(mod26),加密函数Ek(p)=7×p+3(mod26),对应的解密函数为Dk(c)=15×(c−3)(mod26)=15c−19(mod26)。
明文消息China对应的数字序列为(2,7,8,13,0),用仿射密码对明文进行加密:
c=Ek(p)=7×⎣⎢⎢⎢⎢⎢⎡278130⎦⎥⎥⎥⎥⎥⎤+⎣⎢⎢⎢⎢⎢⎡33333⎦⎥⎥⎥⎥⎥⎤=⎣⎢⎢⎢⎢⎢⎡175259943⎦⎥⎥⎥⎥⎥⎤mod26=⎣⎢⎢⎢⎢⎢⎡1707163⎦⎥⎥⎥⎥⎥⎤=⎣⎢⎢⎢⎢⎢⎡RAHQD⎦⎥⎥⎥⎥⎥⎤
对应密文消息为RAHQD
解密:
Dk(c)=15×⎣⎢⎢⎢⎢⎢⎡1707163⎦⎥⎥⎥⎥⎥⎤−⎣⎢⎢⎢⎢⎢⎡1919191919⎦⎥⎥⎥⎥⎥⎤=⎣⎢⎢⎢⎢⎢⎡236−198622126⎦⎥⎥⎥⎥⎥⎤mod26=⎣⎢⎢⎢⎢⎢⎡278130⎦⎥⎥⎥⎥⎥⎤=⎣⎢⎢⎢⎢⎢⎡CHINA⎦⎥⎥⎥⎥⎥⎤
多表代替密码
多表代替密码使用从明文字母到密文字母的多个映射来隐藏单字母出现的频率的分布,其中每个映射都是单表代替密码中的一对一映射。一般来说,我们的做法都是将明文字母划分为长度相同的消息单元,称为明文分组,对明文字母成组地进行代替。
多表代替密码的特点是使用两个或者两个以上的表。
我们主要介绍以下三个多表代替密码:
- 普莱菲尔密码(Playfair Cipher)
- 维吉尼亚密码(Vigenere Cipher)
- 希尔密码(Hill Cipher)
Playfair密码
Playfair密码加密流程如下:
-
将明文中的双字母作为一个单元对待,并将这些单元转换为密文字母组合
-
基于一个5×5字母矩阵,使用一个关键词(密钥)来构造
-
构造方法:从左至右,从上至下依次填入关键词的字母(去除重复的字母),然后再以字母表顺序依次填入其他的字母。加密时字母I和J被算作一个字母
例如,密钥k=playfair is a digram cipher,去除重复字母后,k=playfirsdgmche,可得字母矩阵如下
-
对每一对明文字母P1, P2的加密方法如下:
- 若P1、P2在同一行,密文C1、C2分别是紧靠P1、P2右端的字母。其中第一列被看作是最后一列的右方;(解密时反向)
- 若P1、P2在同一列,密文C1、C2分别是紧靠P1、P2下方的字母。其中第一行看作是最后一行的下方;(解密时反向)
- 若P1、P2不在同一行,也不在同一列,则C1、C2是由P1、P2确定的矩形其它两角的字母,且C1和P1在同一行,C2和P2在同一行;(解密时处理方法相同)
- 若P1=P2,则两个字母间插入一个预先约定的字母,如q,并用前述方法处理;如balloon,则以ba lq lo on 来加密。
- 若明文字母数为奇数,则在明文尾填充约定字母。
例题
密钥不变,延续上文的字母矩阵。明文为p=playfair cipher,用playfair密码进行加密。
明文分组:pl ay fa ir ci ph er
密文分组:LA YF PY RS MR AM CD
特点
- 虽然仅有26个字母,但有26×26=676种双字母组合.因此识别各种双字母组合要困难得多
- 各个字母组的频率要比单字母呈现出大得多的范围,使得频率分析困难得多
- 仍然使许多明文语言的结构保存完好,使得密码分析者能够利用
Vigenere密码
Vigenere密码是最著名的多表代替密码的例子,它使用一个词组作为密钥,密钥中每一个字母用来确定一个代替表,每一个密钥字母用来加密一个明文字母,等所有密钥字母使用完后,密钥又再循环使用
设密钥k=(k1,k2,⋯,kd),明文:p=(p1,p2,⋯,pn),密文:c=(c1,c2,⋯,cn)。
加密变换:Ek(p)=(c1,c2,⋯,cn),其中ci=(pi+ki)(mod26),i=1,2,…,n
解密变换:Dk(c)=(p1,p2,⋯,pn),其中pi=(ci−ki)(mod26),i=1,2,…,n
即对每一个字母都用不同的表去进行移位代替。
例题
p=appliedcryptosystem,k=cipher,用Vigenere密码对其进行加密。
由k=cipher得n=6。密钥对应的数字序列为(2,8,15,17,4,17)。将明文按照每6个字母进行分组,并将这些明文字母转换为相应的数字,再用模26加上对应的密钥数字,加密过程如图所示:
Hill密码
注意,由于Hill密码涉及到矩阵的乘法,所以运算顺序的不同会影响最终的结果。网络上的资料多为密钥右乘,而本文章遵循的是学校PPT教材,采取的方式是密钥左乘(即k×p/c),务必留意。
基本思想:将n个明文字母通过线性变换,将它们转换为n个密文字母。解密只需做一次逆变换即可。
算法的密钥为k={Z26上的n×n可逆矩阵},明文p与密文c均为n维向量,记为:
p=⎝⎜⎜⎜⎜⎛p1p2⋮pn⎠⎟⎟⎟⎟⎞,c=⎝⎜⎜⎜⎜⎛c1c2⋮cn⎠⎟⎟⎟⎟⎞,k=(kij)n×n=⎣⎢⎢⎢⎢⎢⎡k11⋮⋮kn1k12⋱kn2⋯⋱⋯k1n⋮⋮knn⎦⎥⎥⎥⎥⎥⎤
加密变换:Ek(p)=k⋅p=c(mod26)
解密变换:Dk(c)=k−1⋅c=p(mod26)
其中k−1被称为k在模26上的逆矩阵。逆矩阵涉及到线性代数,因此我们需要特别定义一下密钥矩阵k,来保证其逆矩阵存在。
假设A=(aij)为一个定义在Z26的n×n矩阵,如果A在模26上可逆,则有:A−1=A∗/det(A)(mod26)。
其中det(A)为A的行列式,A∗为A的伴随矩阵,Aj,i∗=(−1)i+jMi,j,Mi,j为矩阵A去掉第i行、第j列后剩余元素所组成的矩阵行列式。注意,伴随矩阵需要进行转置处理。
对于一个 n×n 矩阵 A,其伴随矩阵 adj(A) 是由 A 的代数余子式构成的矩阵的转置。
在n=2时,有下列推论:
假设A=(a1,1,a1,2a2,1,a2,2)是一个Z26上的2×2矩阵,它的行列式det(A)=a1,1a2,2−a1,2a2,1,那么有:
A−1=(det(A))−1(a2,2,−a1,2−a2,1,a1,1)
例题
设明文消息为good,试用n=2,密钥k=(11,83,7)的Hill密码对其进行加密,然后再进行解密(明密文分组列向量表示)
因为k=(11,83,7),故det(11,83,7)=11×7−3×8(mod26)=53(mod)=1
k−1=(11,83,7)=1−1×(7,−8−3,11)=(11,1823,7)mod26
将明文划分为两组:(g,o),(o,d),即(6,14),(14,3),加密过程如下:
(c2c1)=k(p2p1)=(11387)(146)=(116178)=(1222)(mod26)⇒(mw)(c4c3)=k(p4p3)=(11387)(314)=(63178)=(1122)(mod26)⇒(lw)
因此,good的加密结果是wmwl。显然,明文不同位置的字母“o”加密成的密文字母不同。
解密变换:由前面计算有k−1=(7,1823,11),可由密文解密计算出明文,过程如下:
(p2p1)=k−1(c2c1)=(7231811)(1222)=(638370)=(146)(mod26)⇒(og)(p4p3)=k−1(c4c3)=(7231811)(1122)=(627352)=(314)mod26⇒(do)
因此,解密得到正确的密文“good”。
特点
- 可以较好地抑制自然语言的统计特性,不再有单字母替换的一一对应关系,对抗“唯密文攻击”有较高安全强度。
- 密钥空间较大,在忽略密钥矩阵k可逆限制条件下,∣k∣=26n×n
- 易受已知明文攻击及选择明文攻击