- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于FPGA的报文分类技术研究
基于FPGA的报文分类技术研究
引 言
随着快速增长的网络链路速率与分类规则的增多,多维报文分类问题成为设计高速路由器的一个基本挑战。例如,当主干网链路速率达到80Gbps时,在报文长度为40字节时,需要每4ns内处理一个数据报,这个速度用现在的软件算法不可能实现。
为了满足以上网络速率的需要,研究人员寻求硬件上的解决方案,三态内容存储器(ternary content addressable memory-TCAM)是一个不错的选择,它能够对输入的关键字进行并行查找,最大的优点是分类速度快,但也有如下一些缺点,如存储面积大、价格高,特别是TCAM不支持直接的范围匹配等。另一方面,由于FPGA具有可重构性和并行性,结合了软件的灵活性与硬件的高效性,使它成为实现实时网络处理引擎一个很好的选择。现在,研究人员已经开始在FPGA上实现一些现有分类算法,可以达到很高的吞吐量,由于存储需求过多,这些算法很少有能够支持大的规则集(超过10K)。本文主要针对基于决策树类的分类算法在FPGA中的实现做了深入研究,解决了在规则集较大的情况下对报文进行快速分类的问题。
1 分类算法的定义及评估方法
1.1 分类算法的定义
报文分类问题有许多定义,它们基本上是等价的,描述如下:报文头部H 包含K个域,分别表示成H[1]、H[2]…H[K],一条过滤规则F相应地也具有K 个域,其中F[i](F的第i部分)是H[i]的正则表达式,如果对任意的H [i]满足正则表达式F [i],则称报文P与规则F相匹配。
对具有N条过滤规则的分类器R来说,为了解决同一个报文与分类器R中多条规则相匹配的问题,在定义过滤规则F时,对每条规则指定了一个优先级,当有多条规则与报文头部匹配时,选择一个优先级最高的作为最终匹配规则。与每条规则相关联还有一个动作,它指出了当报文与此规则相匹配时,下一步所执行的操作,一个包含10规则的简单分类器。
也可以从计算机几何中的点定位问题来看待多维报文分类问题,一个D维的分类规则相当于D维空间中的一个超矩形,D维空间中的N个规则至多可构成(2N-1)D 个互不重叠的超矩形,而一个报文则相当于D维空间中的一个点,所以,多维报文分类转化为找到包含这个点的超矩形。由此可得到,多维报文分类的时间复杂度为O(logN),空间复杂度为O(ND),或是在时间度为O(logD-1 N)的情况下,空间复杂度为O(N)。从上面的分析可以看到,多维报文分类问题是一个非常复杂的问题,幸运的是,现实情况要比这好,真实的分类器没这么复杂,它们有一些自身特点,我们可以在实际中加以利用,可以使分类算法得到简化。
1.2 分类算法的评估方法
由于IP分类问题可以抽象成一个查找表项巨大的多关键字查找问题,因此衡量一个算法好坏的关键是查询速度快,再就是用分类规则来构建查找表数据结构时所占内存要少。考虑到分类算法自身的特点,其它评估方法还有过滤规则的插入与删除速度快,维数(查找中关键字个数)易扩展以及能够根据规则中各个域的不同表现形式,支持多种查询(匹配)方式等。总的来说,算法的关键是怎么找到时间与空间的平衡点。
2 现有的分类算法
现有的分类算法很多,文献对各类算法进行了总结,并对每种类型的算法,列举出了相关的例子;文献根据分类算法对规则进行预处理情况,把它们分为基于分解、基于分割和基于决策树3种情况。
基于分解算法的主要思想是对报文头部的每个域进行独立的搜索,最后把每个域查询结果结合起,就可得到最终匹配规则,该类型的算法适合于硬件实现,典型代表是平行位向量(parallel bit vector)(BV)算法。基于分割算法的主要思想是把原来的规则集划分为若干个子集,每个子集中的规则在单个或多个域之间是没有重叠的,独立集合算法(independent sets algorithm))就属于这类。我们知道,对于有N 条分类规则的D维分类器,算法所需要的空间复杂度为O(ND),现假设把规则集R均匀地划分为K组,每组有N/K个规则,划分后的空间复杂度为O(K*(N/K)D),所以通过规则集划分后,空间复杂度减少为原来的1/KD-1。算法面临的主要挑战是独立规则集划分个数的不确定性和过多。
决策树类的代表算法是HiCuts,它通过对分类器的预处理,建立决策树这种数据结构,树的根点代表整个搜索空间,它“包含”了规则集中的所有规则,对决策树中的每个内部点,都递归地进行如下操作,根据预先定义的某种标准,选择在某一维方向上,相等地切割多少份,直到该结点所“包含”的规则数少于预先定义的某个定值为止,不再进行切割,该结点为叶子结点
您可能关注的文档
最近下载
- GB+39496-2020尾矿库安全规程.docx VIP
- 衡水体英文字母字帖.pdf VIP
- 聚酰亚胺 化学、结构与性能的关系及材料.pdf VIP
- 2025-2026学年小学信息技术(信息科技)五年级上册重大版(2023)教学设计合集.docx
- 迎春杯历年试题全集(上).pdf VIP
- 建筑结构检测鉴定与加固课程-第7章 钢结构加固.ppt VIP
- PW5300_2.0数据手册下载.pdf VIP
- 建筑结构检测鉴定与加固课程-第8章 建筑结构的改造.ppt VIP
- 重大版小学信息技术教案四年级上册教案.doc VIP
- 多因子选股系列研究之十八:成交量激增与骤降时刻的对称性与“一视同仁”因子构建.pdf VIP
- 软件下载与安装、电脑疑难问题解决、office软件处理 + 关注
-
实名认证服务提供商
专注于电脑软件的下载与安装,各种疑难问题的解决,office办公软件的咨询,文档格式转换,音视频下载等等,欢迎各位咨询!
文档评论(0)