- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于加密算法的密文特征识别研究
摘要:在密文识别过程中,加密算法是进一步分析密文的必要前提。然而现有密文识别方案存在形式单一的问题,并且在识别多种密码体制时难以应对不同密码体制间存在的差异。分析密文特征对识别效果的影响机制,结合Relief特征选择算法和异质集成学习算法,提出一种可适应多种密码体制识别情景的动态特征识别方案。在36种加密算法产生的密文数据集上进行实验,结果表明,与基于随机森林的密码体制分层识别方案相比,该方案在3类不同密码体制识别情景下的识别准确率分别提高了6.41%、10.03%和11.40%。
0概述安全的密码体制必须能够抵御各种不同类型的攻击。由于攻击者主要关注如何通过密文获取密钥以及如何将密文恢复为明文,因此诸多以此为目的的攻击方法常针对特定密码体制而设计,其中,设计识别密文所用的加密算法是开展密码分析的重要前提。明文经不同密码体制加密后形成的密文数据并不能达到完全随机,彼此间尚存有微小差异,对此,可通过提取表征密文信息的相关特征作为区分不同密文类别的依据。现阶段研究主要利用机器学习方法和统计学方法对密文所用的加密算法进行识别。相比于利用统计学方法,基于机器学习方法的识别方案设计思路清晰,适应性强,并且可供利用的理论基础丰富,是目前的主流研究方向。文献在现有研究中,所提取的特征基本为借鉴其他领域中有关识别任务中的所用特征,如文献目前,较多识别密码体制的研究基于多种密文特征和分类算法,但研究者较少探讨不同特征对识别性能的影响,并且现有理论框架还有待进一步完善。对此,本文提出一种新的密文特征提取方法,同时完善密码体制识别问题的定义系统,给出提取密文特征的形式化描述。在此基础上,结合特征选择方法设计基于集成学习的密码体制识别方案。比较特征不同的属性对识别方案识别效果的影响,并且使用该方案分别对包含多种序列、分组和公钥密码体制的3种具体识别情景进行实验。1 密文特征建模现有基于机器学习算法的密码体制识别研究基本符合构造新特征,即选择新分类模型的简单研究模式,但较少对该问题进行更深入的探讨,因此,利用现有研究成果难以做进一步推进。另一方面,鉴于密码体制识别问题的理论基础尚不完备。文献鉴于以上考量,本文基于文献遵照文献定义1(密文)设有未知密码体制的密文文件:其中,c获取密文后需要提取密文的特征,定义如下:定义2(密文特征)对未知密码体制的密文文件提取特征,得到维数为d的特征向量:可将提取密文特征的过程抽象为将密文文件F映射为特征v定义3(加工函数)给定未知密码体制的密文F,将密文映射为特征v加工函数的输入对象是密文数据。输入的密文数据可以是密文依顺序按固定长度分块后的每一分块,也可以是各分块相同位置处字节或比特重新组合后的数据定义4给定未知密码体制的密文F和加工函数f,令oper表示加工函数输入对象,即密文数据的组织形式。定义5综合以上定义系统,密码体制识别方案中提取的密文特征可表示为四元组v在定义5中,识别方案提取的密文特征被表述为具有4条属性的四元组。以此密文特征模型为出发点,下文将通过实验比较该四元组中各属性对识别方案效果的影响。2 密文特征及识别方案2.1 特征对比基于上文对密文特征的定义,本节通过实验探究特征的不同属性对识别准确率的影响。依照现有密码体制识别方案,选择AES、DES、3DES、RSA和RC4这五组包含分组、序列和公钥的加密算法从现有研究及密文特征的定义系统出发,此处实验所选特征为v图1所示为所选12种特征的识别准确率比较结果,其中,图1(a)所示为选择不同加工函数密文特征的识别准确率曲线,图1(b)所示为将密文分别表示为比特与字节的有序集合后不同维数特征的识别准确率曲线。由图1(a)可以看出,当以字符出现频率、熵、最大熵和随机性测试作为提取密文特征的加工函数时,以最大熵与随机性测试作为加工函数的特征表现最好。由图1(b)可以看出,在加工函数与密文组织方式相同的情况下,比特类特征与字节类特征的识别准确率差距不大,且不同维数特征间识别准确率的差异不明显。通过分析图1可以发现:在密文特征的4种属性中,密文数据的字符形式C,即提取密文特征时表示密文数据的基本字符单位对识别准确率的影响有限;密文特征的维数d对识别准确率的影响有限;加工函数f选择计算各字符频率的特征远不如以随机性测试和信息熵为加工函数的特征,且以熵或最大熵作为加工函数的特征表现更稳定,适应性更好。此外,在提取密文特征时,对密文数据的不同组织方式也对识别效果有较大影响。综合以上分析,本文选择以ASCII表中的256种字符作为表示密文数据的基本字符。对于密文数据的组织方式oper,此处选择将表示密文数据的字符重新组合的方式,
文档评论(0)