- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘在高校招生信息化中的运用
数据挖掘在高校招生信息化中的运用
摘要:数据挖掘是一门交叉性学科,它注重潜在能量,我们可以从广博的数据库中,找到大量有价值的知识、图片、文字等重要信息内容。数据库技术、网络技术以及计算机硬件,是时代发展的科技结晶,它在贮存大量数据的同时,也扩大了人们采集数据的范围。经过多年的发展,数据挖掘已经在商业、金融、医疗等各个领域得到了广泛的应用。本文从数据挖掘的含义、功能出发,探究了数据挖掘的种类和内容,以及在高校招生信息化中的运用。
中国论文网 /8/view-7241537.htm
关键词:数据挖掘;数据库技术;信息化;运用
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)01-0001-02
数据挖掘又称为数据库中的知识发现,是指从很泛很杂且朦胧的数据提取,同时数据提取又是非常隐秘的,人们无法预知的,但是它又真实的潜藏在,有价值的信息传播过程中。
1 数据挖掘概述
数据挖掘是由统计学、人工智能、数据库、可视化技术等,与当代科技相融而成的,一门交叉性学科,是发现知识的重要工具。计算机硬件与数据库技术的持续增长,在一定程度上带动了,数据信息的发展,但与此同时,保存在数据库之中以及计算机磁盘里的容量信息,却在一步一步锐减。数据信息的肆意增长,渐渐蒙蔽了人们的双眼。然而,数据挖掘技术的出现,却妥善的消除了信息弊端,使人们在网络信息数据库中,找到了真正有实用价值的资源。
2 数据挖掘的功能
数据挖掘的具体功能主要分为以下几个方面:
概念描述可以分为两种,一是特征性描述,二是区别性描述,概念描述的真实含义,就是对指定对象的内在心理,进行语言描述,并说明这类对象的主要特点。特征性描述的是同一种事物的共性,区别性描述的是同一类事物的差异。描述数据的存在形式,可以是多样化的、朦胧式的,它的主要功能,就是用户的数据考察。
1)关联分析
数据之间的关联性,是数据库中存在的一种十分重要的,容易被人挖掘的信息资源。如果多个变量的取值之间,存在着强烈的逻辑性,那么它就被称为关联。关联通常会被分为三种,一是简单关联、二是时序关联、三是因果关联。关联分析是从大量的数据中,集结而来的微妙关系,也分为前后关系和因果关系,相互牵连。
2)分类与预测
分类数据的探究和摸索,是一项任重而道远的任务。分类的原因是受系统中的,分类函数和分类模型的影响。这种模型可以把数据资料库中的,数据项目传送到定类数据中,从而构成分类器,但要完成传输任务,系统这时就需要有一个模型样本数据集,作为传输工具。
预测是系统利用历史数据而设置的一个初步模型,再运用新的数据作为输入值,这样就可以得出未来的数据倾向值,或是结合评估和样本模型,才能获取具体的属性值或是值数的范围。
3)聚类
聚类的含义是指,同一种相似类型的数据,相互之间存在的差异性,依照数据的不同特点,通常意义上,要将他们归纳为不同的数据种类。其目的是在距离上缩小,同一种类型的数据差异,同时在另一个角度,要拉大不同数据种类之间的距离。聚类与分类的区别主要体现在:分类需要提前给数据一个定义类别和模型样本;而聚类分析就只有一个方向,那就是数据根源,不需要提前预定数据类别,也不需要模型样本,所有的传输记录,都会根据事物的相似性,汇集成同类数据 。
4)偏差分析
偏差分析又名为比较分析,是对差异性和特殊个体的描述,揭示了个体区别于其他事物的反常现象,其根本思想就是,寻找到观测结果与参照值之间的具体差别性。偏差包含了分类中的反常事物、不符合事实的特例以及观测结果,甚至于对模型预测的差异性、数量值随时间的变化等。
3 数据挖掘处理过程
数据挖掘的过程是多样化的,需要细心分析,它大致可以分为问题定义、数据收集和预处理、数据挖掘,以及结果表达和解释等。
1)问题定义
数据挖掘的主要任务,就是要从大量信息数据库中,寻找到可使用的信息资源。知识应是数据挖掘的一个重要步骤,在问题定义阶段中,数据挖掘人员一定要,与相关知识的专家联合,确定挖掘目标,以及对数据统计的具体要求,最后通过不同的计算法则,选出最适合的计算方式。
2)数据准备
数据准备可以简单地分为三个步骤,一是数据选取、二是数据预处理、三是数据变换。数据选取的含义是,根据已有信息数据,从最初的原始数据库中,查找出适合数据挖掘的信息资源。数据预处理是对,数据信息贮存的再分类,这其中包含了数据检查的整体性,数据信息的统一性,以及数据内部结构,消除杂音、弥补数据遗失、删除过期数据等程序。数据变换的主要用途是,在一定范围内,消除和减少数据维数,其方法就是,从数据的最初特点中,寻找到可以使用的数据特点,使数据在挖掘过程中,最大额度的减少特征
您可能关注的文档
最近下载
- YY0306-2018 热辐射类治疗设备安全专用要求.pdf VIP
- 电力工程项目建设用地指标(风电场)(建标〔2011〕209号).pdf VIP
- 商品混凝土采购组织供应、运输、售后服务方案.docx VIP
- 《合成生物学》课件.pptx VIP
- 《中国文化概况》带翻译版.pdf VIP
- 消除艾滋病、梅毒和乙肝母婴传播项目工作制度及流程(模板).docx
- 2.1.2 认识地球(第2课时 地球仪与经纬网)七年级地理上册课件(湘教版).pptx VIP
- 二年级上册1-8单元看图写话.pdf VIP
- YY/T 0061-2021特定电磁波治疗器.pdf
- 沥青路面旧路改造工程施工方案.docx VIP
文档评论(0)