基于决策树的SM4分组密码工作模式识别.docxVIP

下载本文档

6
0
约3.96千字
约 4页
2021-08-08 发布于湖北
举报
版权申诉

基于决策树的SM4分组密码工作模式识别.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于决策树的SM4分组密码工作模式识别 0 概述密码学包括两个重要的分支：密码编码学和密码分析学。在信息时代，网络安全已成为国家安全的重要组成部分，而密码编码学和密码分析学在其中扮演着不可或缺的角色。目前，网络空间不仅存在众多的数据类型，例如视频、文本、图像等，而且数据量大、冗余度也高。为此，需要研究合理的数据处理方案。机器学习与密码学的结合为处理大量密文数据提供这种可能。机器学习提供了聚类分类算法来处理和分析数据，而密码学为越来越被重视的数据安全保驾护航。密码编码学是一种保护信息在传递过程中不被第三方或者敌方所解读、利用和窃取的技术，它解决的主要问题是信息的安全性问题。在现实生活中，总会存在一些用户在未经信息持有者授权或者本就无意愿将信息共享的情况下，对所传输的信息进行非法获取、恶意篡改、以及删除和伪造。密码学者对此采取的措施主要是使用密码分析技术来进一步完善所设计的密码方案并优化方案中所包含的密码算法。目前较为熟悉的密码分析技术都是基于Kerckhoffs1 相关工作基于密文特征的密码体制识别往往都同机器学习技术相得益彰上述工作主要针对不同密码算法进行识别，或者在特定工作模式下进行识别，而缺乏对分组密码工作模式的识别，特别是国密SM4分组密码算法的工作模式识别。分组密码的工作模式又对密码算法的识别起着主导作用，这将对舆论分析、互联网审查、电子取证和网络监控具有推进作用。无论是对不同算法识别还是对分组密码工作模式的识别，都利用机器学习将其视为模式分类的问题，使用机器学习的各种分类方法来尝试捕获加密后的密文文件中隐含的行为。通过机器学习算法对大量密文文本进行分析计算，生成对应的分类模型，再将测试文本投入分类器中，进行比较，最后得到分类结果。这样就可以避免人为的去分析论证密码工作模式本身的区别，而是将这一行为交由机器学习去完成，通过与统计学方法的结合，智能的挖掘和分析在同一明文文本集下经由不同工作模式加密后产生的密文文本之间所隐含的不同信息。本文主要研究SM4分组密码的工作模式进行识别方法。SM4算法是我国国家密码管理局提出的一种分组长度和密钥长度均为16字节的分组密码算法，适用于无线局域网产品。它的安全性能较高，可以抵抗差分、线性和代数等分析技术。SM4算法现已实现的工作模式有六种，在本文中用到了CBC（密文分组链接模式）、CFB（密文反馈模式）、CTR（计数器模式）和OFB（输出反馈模式）四种。若直接使用SM4算法加密消息，它的安全性是非常脆弱的。为了在不同的场景中更好地保护明文的安全性，需要借助不同的工作模式。对工作模式的识别能够提高密码算法的安全性，从而更好地抵抗密码攻击。本文提出了基于C4.5的分组密码工作模式识别方案并对国密SM4算法的四种工作模式进行识别。该方案首先利用加密工具在不同的工作模式下对大量的文本文件进行加密，得到密文文件。然后构造训练阶段和测试阶段所需的特征向量空间，该空间是由特征提取算法对密文文件处理后得到的，每个特征向量中包括五个值，即大写字母数量，小写字母数量，数字字符数量，其他字符数量，标签值。在此基础上，训练阶段通过对特征空间的学习生成决策树。测试阶段根据生成的决策树进行决策，最后将决策值与标签值相比较得到分类结果。实验结果表明，在一对一分类模型中，CBC、CFB、OFB和CTR之间的识别正确率达到90%以上。上述实验结果表明国密SM4算法的工作模式具有一定的可识性。为了增强SM4算法在应用中的安全性，需要进一步研究其工作模式的隐藏方法。2 系统模型如图1所示，本文设计了基于决策树的密码体制识别系统。整个识别系统包括四个部分：1)关于特定工作模式的密文文件；2)密文特征提取；3）生成决策树模型；4）测试分类。分组密码的工作模式将明文加密成特定密码工作模式的密文文件后，再对其进行特征提取。特征提取的工作是最重要也是最难的一步，因为其本质是对密数据的处理和分析，而且它对后续模型的生成和分类的结果起着决定性的作用。特征提取的方法很多，如统计学方法、随机性检测对密文数据特征提取后，就进入学习和分类的过程了，这是机器学习算法的本质。机器学习算法包括两个阶段，第一阶段是训练阶段，即将得到向量空间的一部分传递给决策树算法进行学习，并生成分类模型，也称决策树模型。第二阶段为测试阶段，即将向量空间的另一部分投入到机器学习算法中进行测试，依据训练阶段生成的决策树模型来进行分类。训练阶段和测试阶段的向量空间中都包含密文的特征，而决策树算法是有监督学习算法，它的学习标签包含在训练阶段，而在测试阶段将标签隐藏，待测试完成后，用决策树模型预测的结果与测试数据所隐藏的标签进行对比，就可得到实验的结果。在得到结果之前，要借助决策树算法第1步：假设有包含信息熵: