- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
单表代替密码技术在表意文字加密中应用
单表代替密码技术在表意文字加密中应用
摘 要:文章通过对比英文字符和汉字之间的差异,提出了一种可用于对汉字等表意文字进行加密的单表代替密码技术。该技术通过使用双方约定的文字信息构成私有字库,同时通过汉字补充形成总字库;在使用时,将明文使用构成的总字库进行Caesar加密,形成密文,为了保证加密过程的安全性,需要实时地更新私有字库的文字信息。采用穷举攻击、单字频率攻击、双字组合频率攻击对单表代替密码技术的加密过程进行安全性分析,经验证,在三种攻击条件下该技术均能保证文字信息的安全。针对最新提出的特殊字攻击方法,文章提出了避免攻击的办法。
关键词:汉字;表意文字;信息加密;实时动态;特殊字攻击
1 文字的分类与研究现状
1.1 拼音文字与表意文字
如通过类似于拼音一样的方法,将字母组合在一起,形成单词,然后再通过空格等间隔符号构成一句话,这样的文字称作拼音文字;像汉字、彝文字等,用象征性书写符号记录词或词素的文字,称作表意文字。
这两种文字形式有很大的不同,拼音文字基本组成的字符元素简单,如英文仅有26个英文字母;而表意文字却不一样,他们的基本组成复杂,如果将汉字每一个字看作基本字符元素,那么表意文字的基本字符元素的集合相对于拼音文字会庞大很多,这也就导致了两种文字在加密方面产生了差异。
时至今日,我国的汉字、彝文字是世界上为数不多仍在使用的表意文字,这也就导致了较难从其他国家借鉴经验来研究表意文字的加密。
1.2 汉字的特点及其加密研究现状
在《中华大字典》中收录了48000左右汉字[1],根据《现代汉语常用字表》的联合通知,表中的3500个字在语料(约200万字的《人民日报》等大众读物)中的覆盖率达到99.48%[2]。如果再统计常用词组、短语及专业词汇,约有一百万左右。
在对于汉字加密的研究中,大部分是基于中文的GB码或Unicode码进行的[3],甚至还有一些仅仅是在Java、ASP或者VB中的简单应用。结合汉字本身特点的研究有:胡善岳等提出根据整数串代表百万个常用汉字、词语,在整数串中加入统计频数和所在的不同表,构成9位整数串,然后结合DES和RSA算法进行加密[1];赵杰通过考虑汉字的笔顺、笔画、字根和字形等,并进行拆分编码,然后结合一系列常用的加密方法分析[3]。
2 文字加密所用代替技术
代替技术是将明文的字母或者文字用其他的字母、文字、数字、符号表示的方法。它属于古典加密方法,是一种对称密码模型,包含Caesar密码、单表代换密码、Playfair密码、Hill密码、多表代替密码(Vigenere密码、Vernam密码)、一次一密,等。
进行加密的过程中使用Caesar密码、单表代换密码,在英文加密(可以代表拼音文字)过程中安全性不能达到很高的保证。Caesar密码加密的文字可以使用穷举法攻击;对于单表代换密码加密的文字使用密码分析学的内容――通过分析其出现频率、统计双字母混合、单词联想可以破解。[4]由于汉字作为表意文字的不同特性,在这些方面很难破解。
2.1 Caesar密码技术
Caesar密码技术应用于英文中,是通过对字母表中的每个字母用它之后的第k个字母来代替。
相对于3500个常用汉字的加密,首先根据这些汉字在《现代汉语常用字表》中的顺序,依次等价于一个数值。在这里仅用3500个常用字进行算法说明,在实际应用中,存在非常用字,会大于3500。在这里排列的可能性只有3499种,很容易进行穷举攻击,不过这是作为文章实际加密算法中最后使用,不存在穷举攻击后就得到明文的情况。
2.2 单表代替密码技术
如果上面所有汉字任意代替,密钥空间将会急剧增加。一般,具有N个元素的集合会有N!种置换。由于消息的加密对应有一个汉字映射表,所以称作单表代替密码。3500个汉字进行任意置换,那么排列的方法就有3500!种可能的密钥。
3 表意文字具体加密实施
在实际的应用过程中,整个加密的流程图如图1所示,具体过程如下。
3.1 生成私密字库
这一步相当于单表代替密码中形成单表的过程,在这里需要一些加密者和接收用户约定的文章或者文字内容,将这些内容中的不重复的汉字依次取出,构成私有字库。过程中会有很大可能出现非常用汉字,这也保证了更好的信息加密效果。
在构成私有字库的时候,可以约定这些文字来自于发送密文当天某报刊网站的第一个版面的文字等。这就达到了实时动态效果,使得攻击者几乎不可能找到形成单表代替密码中的单表,也就是如果破解相当于需要穷尽破解。
3.2 生成私有补充字库
在我们生成的私密字库中,有很大可能性不能够包含3500个常用字。为了防止出现要加密的源信息(明文)中汉字在私
文档评论(0)