- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
串匹配算法及其在网络内容分析中的应用计算机软件与理论专业论文
串匹配算法段荩在膀络内容分析中的应用:摘要摘要
串匹配算法段荩在膀络内容分析中的应用:摘要
摘要
Internet是全球信息共享的基础设施,是一种开放和面向所有用户的技术。一方面要 保证信息方便、快捷的共享,另一方面要防止垃圾的传播。网络内容分析是一种管理信 息传播的重要手段。网络内容分析是网络信息安全核心理论与关键技术,对解决国民经 济发展和国防建设具有重大意义。研究网络内容分析所涉及的新理论、新体系结构、新 方法和新技术将是未来几年研究的重要挑战。
~方面是人们生活越来越多地依靠网络,许多政府业务越来越多地使用网络,面另 一方面却是Internet上信息的鱼龙混杂,黑客、病毒、网络攻击等日益盛行。保护网络 空问的洁净,保护网络空间中的“国土”,已成为未来国家发展的重要问题,也是摆在 人们面前的一个巨大挑战。
从闪电般流逝的网络数据中查找到我们感兴趣的信息,无疑是一项非常富有挑战性 的工作。本文的工作是从研究面向宽带互联网的网络信息安全问题出发,对高速网络内 容分析所涉及的科学理论和关键技术进行了有益探索。本文从算法和框架两个层次来讨 论快速信息分析技术,有以下几点创新之处:
1.1.1串匹配算法IntMatch 从面向计算机指令层面来优化匹配算法,设计了一种新的串匹配算法。新设计的
IntMatch是一种简洁串匹配算法。它使用的数值计算代替字符比较的思想很容易推广到
其它领域,具有~定的理论价值。ImMatch算法可以在高速网络内容分析、大规模模式 的入侵检测系统中使用。某些测试表明,IntMatch比Sun.Manber等算法大约快175%。 IntMatch算法是一种跳跃型的算法,设计的主要思路是充分利用硬件整数操作的效率, 使用数值运算代替字节比较。
1.1.2关键词表达式匹配算法
经典的关键词表达式(query expressiont keywords expression,predicate Mgofithm for rule)是搜索引擎(web retrieve)和数据库等使用的查询语言。但是在网络内容分析系 统中,如果单纯使用关键词作为查询条件,会存在很多误报情况。所以网络内容分析系 统-般采用表达式作为查询条件。我们提出了一种新关键词表达式匹配算法。这种算法 改进了经典计数算法(predicate counting algorithm)中不适合网络内容分析环境的数据 结构,对比计数算法需要平方级的算法复杂度,新算法可以在线性复杂度完成内容扫描 阶段的关键词表达式匹配工作。关键词表达式匹配算法还可以广泛地应用于基于调用序
i
串匹配算法及其在数据流监管系统中的应用列的入侵检测系统中。
串匹配算法及其在数据流监管系统中的应用
列的入侵检测系统中。
1.1.3面向网络内容分析的文本表示方法
本文一种新的基于n-gram字的文本表示方法同时实现了一个文本分类系统。这个系 统自动提取网络内容分析所需要的关键词,进行网络内容的感情色彩判断和内容分类。 基于n.gram字的文本分类方法比基于单纯串匹配算法的文本分类方法正确率更高,而 且性能基本保持不变。与词、短语等向量空间的文本表示方法相比较,在正确率损失不 超过1%的前提下,大幅度地提高文本分类的速度。
1.1.4扁平结构的网络内容分析框架 扁平结构是高性能协议栈的一种实现方式。使用扁平结构,我们设计了--jfeo高速骨
干网络内容分析系统。系统针对大量数据连接的特定领域,采用了把应用层协议解析和
部分文档格式分析统一在一个层次处理的方式,可以在两次数据扫描中,完成应用协议 解析、文档格式分析和规则匹配工作。相对于先进行协议分析,再进行文档格式分析, 最后进行规则匹配的一般处理流程,这种新的框架,节省了多次数据复制和数据扫描的 时间,从而提高了网络内容分析系统的性能。同时,这种把各种应用层协议解析和各种 编码转换工作统一处理的方式,可以方便地增加新的应用协议和统一优化应用协议解析 的性能。我们实现的原型系统表明了这种把关键词扫描、协议分析、编码等融合在一起 的模型是可行的。
从更广泛的角度来说,网络内容分析技术是数据流管理的一个应用。数据流管理是 处理相对固定不变的大量查询和源源不断的流动数据的技术。我们一直有一个想法,就 是建立一套类似数掘库管理系统的数据流管理系统,它能为许多应用提供类似SQL一 样的标准查询语言。我们希望它能成为基础性系统软件,为国家安全和经济建设提供核 心技术支持。本研究可以看作这个方向上的一个尝试。
关键字: 网络内容分析,数据流管理,网络安全,网络监控,关键词匹配,串匹配,
模式匹配,组合关键词匹配,算法设计,协议分析,文本表示, 文本分类
String
String Matching algorithm and Application
您可能关注的文档
- 安徽省地质博物馆公共文化服务问题及对策研究公共管理专业论文.docx
- 非局域平衡等离子体模型的建立和模型的实验应用物理学专业论文.docx
- 俄语经济术语隐喻研究外国语言文学;俄语语言文学专业论文.docx
- 初一学生数学课前预习现状调查研究学科教学数学专业论文.docx
- 超声评价松质骨状况的参量及方法研究电路与系统专业论文.docx
- 电渗泵毫米整体柱电色谱联用测定食品防腐剂分析化学专业论文.docx
- 动态环境条件下的组织学习与企业绩效管理科学与工程专业论文.docx
- 半互穿网络聚甲基丙烯酸酯系吸油材料研究纺织工程专业论文.docx
- 埃森哲订单管理外包运作策略研究工商管理专业论文.docx
- 福斯特生态革命思想研究马克思主义基本原理专业论文.docx
- 翻译伦理观观照下冰心翻译思想研究英语语言文学专业论文.docx
- 电力企业财务风险评价与预警研究管理科学与工程专业论文.docx
- 动态电压恢复器电压跌落检测和控制策略研究检测技术与自动化装置专业论文.docx
- 经肝动脉灌注不同化疗药物联合肝动脉栓塞治疗中晚期肝细胞癌的临床研究内科学专业论文.docx
- 钝体高柔结构横风向气弹失稳机理的数值研究结构工程专业论文.docx
- 低码率视频流误码鲁棒性的研究通讯与信息系统专业论文.docx
- 半线性椭圆边值问题的无网格方法计算数学专业论文.docx
- 沟叶结缕草体细胞无性系变异研究园林植物与观赏园艺专业论文.docx
- 公共租赁住房租金定价机制优化研究管理科学与工程专业论文.docx
- 当代大学生竞争心理特点与人格特征的关系研究发展与教育心理学专业论文.docx
文档评论(0)