- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
KDD99数据集课案
新 疆 大 学
毕业论文之任务报告2
班 级:信息安全11-1
姓 名:乔萨础拉
论文(设计)题目:面向网络安全的测试数据集构建工具实现
论文(设计)来源:指导老师拟定
要求完成的内容: 1.了解NETPDL 和KDD99数据集
指 导 老 师:努尔布力
XML技术
1.1 可扩展标记语言(XML)简介
XML(eXtensible Markup Lanauage)即扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。源自于标准导引标识语言 SGML(Standand Generalized Markup Lanauage)。SGML是一种灵活描述数据的语言,早期以它的的强大描述能力和灵活性而广泛应用于出版业,但它有一个缺点,就是使用起来相对复杂,不易推广。而 XML 是一个简化版本的 SGML。它提供 80%的 SGML 能力。应用起来方便很多,XML 是一个平台独立的描述数据的一个标准。
XML可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。 它非常适合万维网传输,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。是Internet环境中跨平台的、依赖于内容的技术,也是当今处理分布式结构信息的有效工具。
1.2 XML的特点
?? XML的特点有:1、XML使用Unicode字符集,可生成英文、中文、希腊文等多种语言。2、可将多个来源汇合进一个XML文档。3、可利用DTD或Schema(模式)管理一致性问题。DTD主要用于文档型文档,Schema主要用数据型文档。4、具有很好的扩展性,可定义自已的元素和属性。5、通过XML可从关系数据库管理系统中提取数据到结构化文档。它还被设计成可对各种数据对象进行操作。6、在一个设计良好的XML应用中,XML标记不涉及文档如何显示,只表示文档的结构。
1.3 XML的语法
1)元素:它的语法格式如下:
标签文本内容标签
元素是由起始标签、元素内容和结束标签组成。用户把要描述的数据对象放在起始标签和结束标签之间。
无论文本内容有多长或者多么复杂,XML 元素中还可以再嵌套别的元素,这样使信息构成等级结构。
(2)处理指令
处理指令给 XML 解析器提供信息,使其能够正确解释文档内容,它的起始标识是“?”,结束标识是“?”。常见的 XML 声明就是一个处理指令:
?xml version=”1.0”?
处理指令还可以有其他的用途,比如定义文档的编码方式是GB 码还是 Unicode 编码方式,或是把一个样式单文件应用到 XML 文档上用以显示。
(3)注释
注释是 XML 文件中用作解释的字符数据,XML 处理器不对它们进行任何处理。注释是用“!--”和“ ”引起来的,可以出现在XML 元素间的任何地方,但是不可以嵌套:
!—这是一个注释
(4)根元素和子元素
如果一个元素从文件头的序言部分之后开始一直到文件尾,包含了文件中所有的数据信息,我们称之为根元素。XML 元素是可以嵌套的,那么被嵌套在内的元素称为子元素。
(5)属性
属性给元素提供进一步的说明信息,它必须出现在起始标签中。属性以名称/取值对出现,属性名不能重复,名称与取值之间用等号“=”分割,并用引号把值引起来。例如:
proto name=”Ipv4” /proto
1.4访问XML
Document Object Model(文档对象模型)简称为DOM,是对Web文档进行应用开发、编程的应用程序接口(API),是W3C公布的一种跨平台的、于语言无关的接口规范[4]。
DOM采用对象模型和一系列的接口开描述XML文档的内容和结构,即利用对象把文档模型化。这种对象模型实现的基本功能包括:
(1) 描述文档标示和操作的接口;
(2) 接口的行为和属性;
(3) 接口之间的关系以及互操作。
DOM对结构化的XML文档进行解析,文档中的指令、元素、实体、属性等所有个体都可以用对象模型标示。整个文档的逻辑结构类似一棵树,生成的对象模型就是树的节点,每个对象同时包含了方法和属性。利用DOM,开发人员可以进行动态地创建XML文档、便利结构、添加、修改、删除内容等操作。DOM面向对象的特性,使人们在处理和XML解析相关的事务时节省大量精力,是一种符合代码重用思想的强有力编程工具[16]。
2.KDD99数据集
2.1 KDD99数据集简介
1998年美国国防部高级规划署(DARPA)在MIT林肯实验室进行了一项入侵检测评估项目。林肯实验室建立了模拟美国空军局域网的一个网络环境,收集了9周时间的?TC
文档评论(0)