基于双重特征的协议识别方法.pdfVIP

下载本文档

2
0
约7.78千字
约 3页
2018-05-09 发布于福建
举报

基于双重特征的协议识别方法.pdf

基于双重特征的协议识别方法胡庆安，吴明慧 (西南交通大学信息科学与技术学院，四川成都 610031) 誊 j| l 。特征就有可能发生变化，要准确识别就需要重新分析提取设线性可分的训练样本集毒 0i规则，而这一类流行软件的升级是很频繁的。另外，基于 s={(x，Y．)lX；∈Rn；Y ∈{+l，-1)li=l，2，，n} 鹫规则的分析和提取如果要面面俱到，也是难以做到的。还满足 y；(w x；+b)一l≥0 有很多软件采用的是加密协议，要想破解其加密算法是很此时分类间隔等于2／llw ¨，使间隔最大等价于困难的，甚至是不可能的。使 ① (w)= ¨w ll 最小。此时求最优分类面的问题可以转化为下面的约束优化问题： 3基于流量特征的sVM识别方法在约束条件缶 ’r刮和fl；；}0，i-I，2，…，n下对ai 与基于payload特征的方法相比，基于流量特征的方求解下列函数的最大值：法有下列优点： r 1 H {max∑q一言∑∑ Y*Y(xrxj) (1)易于识别加密协议。只关注流量特征，不关注具 L l=l ‘l=li=I 体负载数据特征，完全不受数据加密的影响。 SVM 的核心思想是利用满足Mercer条件的核函数代 (2)利用从观测数据 (样本 )获得的规律对未来数据可替一个非线性映射，使得输入空间中的样本点能映射到一以进行预测。即使是经常版本升级的软件，其使用的协议个高维的特征空间，并使之在该空间中线性可分，然后构一般来说不会有大的变化，大部分都是小的修改，这样就造一个最优超平面来逼近理想分类结果。可以通过以前的流量特征对它进行预测。 SVM算法有以下几个显著的优点： (3)通过智能识别的方法，不需要对每个数据包的净 (1)它是专门针对有限样本情况的，根据有限的样本载进行匹配和深度探测，所以效率和安全性更高。信息在模型的复杂度和学习能力之间寻求最佳折衷，以期它的缺点在于：识别方法较为复杂，在协议的实时细获取最好的推广能力。分上指向性不强。 (2)算法最终将转化成为在线性条件限制下的二次优流量特征包含了网络用户数据请求与服务器响应发送化问题，理论上得到的是全局最优点，解决了在神经网络数据包过程中的各类行为要素，包括时间、频度、IP、端方法中无法避免的局部极值问题。口、包长、协议声明特征、发送指纹等。在统计分析中的 (3)算法将实际问题通过非线性变换转换到高维的特行为特征上，不同协议类型的应用数据传送之间具有很高征空间，在特征空间中构造线性判别函数来实现原空间中的区分度，且不论内容如何，均相对为固有特征。因此，的非线性判别函数，巧妙地避免了 “维数灾难”问题其算 ■本模型采用的基于SVM的流量特征检测方法可以准确地一一，对网络协议进行分类。法复杂度与特征空间的维数无关。 SVM (支撑向量机 )是基于结构风险最小化的普适，而有效的统计学习理论最具代表性的新型小样本学

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于双重特征的协议识别方法.pdfVIP