信息系统工程基础.ppt

  1. 1、本文档共427页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
图5.58 新的聚类边界 5.5.1 X1 X2 种子2 种子1 种子3 * 第四百一十五页,共四百二十七页。 5.5.2 决策树 决策树(decision tree)是一种多用途的数据挖掘方法,主要可分为 两种类型:分类树和回归树。 分类树将每一个数据记录分配给合适的类别,而且还可以提供这种分类 正确与否的置信度。回归树预测一个变量的值。 * 第四百一十六页,共四百二十七页。 叶点1 叶点6 叶点5 叶点4 叶点3 叶点7 叶点2 叶点8 50 Y 100 100 X 55 32 20 20 80 5.5.2 图5.59(a) 决策树的例子 * 第四百一十七页,共四百二十七页。 是 圆 叶点7 三角 叶点1 三角 叶点8 否 Y50 是 X55 Y32 X80 否 是 否 X20 X20 是 是 是 否 否 否 三角 叶点4 三角 叶点2 圆 叶点6 圆 叶点3 Y20 圆 叶点5 是 否 5.5.2 图5.59(b) 决策树的例子 * 第四百一十八页,共四百二十七页。 5.5.3 神经网络 神经网络是一种主要的数据挖掘方法。提出神经网络这一概念的人并不是统计 学家或数据分析学家,而是研究机器学习的学者,其初衷是模拟果蝇、蚯蚓或 人等生命体的神经系统网络。不过不管最初提出神经网络这一概念的目的是什 么,从数据挖掘的角度来看,神经网络只是另外一种建立模型观测历史数据以 进行分类或预测的方法。 图5.61 简单神经网络 输入层 输出层 X Y 3 2 Z+1 * 第四百一十九页,共四百二十七页。 图5.62 有隐性层的神经网络 5.5.3 输入层 I1 I2 W0 W10 H1 W20 H2 Z W2 W1 W22 W11 W12 W21 X Y 隐性层 输出层 * 第四百二十页,共四百二十七页。 5.5.4 关联规则 关联规则的形式化描述: 假设 I={i1,i2,…,im}是一个有m个项目的数据项集合,称为项目集(itemset); D是一个事务(或交易)数据库;事务T是I中的一组项目,即T?I。对于数据项 集X和Y,如果X?T,则称事务T支持X。关联规则是形如X?Y的蕴含式,其中X?T, Y ? T,且 X?Y = ? 。 描述关联规则属性的四个参数: (1) 可信度(Confidence)。 (2) 支持度(Support)。 (3) 期望可信度(Expected confidence)。 (4) 作用度(Lift)。 关联规则是美国IBM公司Almaden研究中心的Rakesh Agrawal等人于1993年首先提出的,是表示数据库中一组对象之间某种关联关系的规则。 * 第四百二十一页,共四百二十七页。 表6.1 参数的表示方法 5.5.4 名称 描述 公式 作用度 可信度对期望可信度的比值。 P(Y|X) P(Y) 可信度 在数据项集X出现的前提下,Y出现的概率。 P(Y|X) 支持度 数据项集X、Y同时出现的概率。 P(X?Y) 期望可信度 数据项集Y出现的概率。 P(Y) * 第四百二十二页,共四百二十七页。 5.5.5 可视化技术 可视化是用图形显示数据库中的数据的技术。 (4) 用可视化方法来引导数据挖掘过程。 将数据挖掘和可视化技术的集成有四种可能的途径: (1) 用可视化方法显示数据挖掘的结果。 (2) 将数据挖掘方法应用于图形化的数据。 (3) 用可视化作为数据挖掘方法的补充。 * 第四百二十三页,共四百二十七页。 参 考 文 献 [1] 王众托. 系统工程引论. 电子工业出版社, 1985 [2] 胡道元. 计算机局域网. 清华大学出版社, 1992年 [3] 黎洪松, 裘晓峰. 网络系统集成技术及其应用. 科学出版社, 1999 [4]“系统集成指南”.计算机世界, 1995年 [5] 万博通公司技术部. 网络系统集成行业实用方案. 海洋出版社, 1998 [6] 薛华成. 管理信息系统. 清华大学出版社, 1999 [7] 李建中,王珊. 数据库系统原理. 电子工业出版社, 1998 [8] 张海潘. 软件工程导论. 清华大学出版社, 1999 [9] 殷人昆,田金兰,马晓勤. 实用

文档评论(0)

虾虾教育 + 关注
官方认证
内容提供者

有问题请私信!谢谢啦 资料均为网络收集与整理,收费仅为整理费用,如有侵权,请私信,立马删除

版权声明书
用户编号:8012026075000021
认证主体重庆皮皮猪科技有限公司
IP属地重庆
统一社会信用代码/组织机构代码
91500113MA61PRPQ02

1亿VIP精品文档

相关文档