- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘
引言
数据挖掘是一门交叉学科,涉及到了机器学习、模式识别、归纳推理、统计学、数 据库、高性能计算等多个领域。
所谓的数据挖掘(Data Mining)指的就是从大量的、模糊的、不完全的、随机的数
据集合中提取人们感兴趣的知识和信息,提取的对象一般都是人们无法直观的从数据中 得出但又有潜在作用的信息。从本质上来说,数据挖掘是在对数据全面了解认识的基础
之上进行的一次升华,是对数据的抽象和概括。如果把数据比作矿产资源,那么数据挖 掘就是从矿产中提取矿石的过程。与经过数据挖掘之后的数据信息相比,原始的数据信 息可以是结构化的,数据库中的数据,也可以是半结构化的,如文本、图像数据。从原 始数据中发现知识的方法可以是数学方法也可以是演绎、归纳法。被发现的知识可以用 来进行信息管理、查询优化、决策支持等。而数据挖掘是对这一过程的一个综合性应
目录
TOC \o 1-5 \h \z \o Current Document 引言 1
第一章绪论 3
1.1数据挖掘技术的任务 3
\o Current Document 1.2数据挖掘技术的研究现状及发展方向 3
第二章数据挖掘理论与相关技术 5
2.1数据挖掘的基本流程 5
2.2.1关联规则挖掘 6
\o Current Document 222 . Apriori算法:使用候选项集找频繁项集 7
\o Current Document . FP■树频集算法 7
\o Current Document 2.2.4.基于划分的算法 7
\o Current Document 2.3聚类分析 7
2.3.1聚类算法的任务 7
\o Current Document COBWEB 算法 9
\o Current Document 2.3.4模糊聚类算法 9
2.3.5聚类分析的应用 10
第三章数据分析 11
第四章结论与心得 14
4.1结果分析 14
4.2问题分析 14
4.2.1数据挖掘面临的问题 14
4.2.2实验心得及实验过程中遇到的问题分析 14
参考文献 14
第一章绪论
1.1数据挖掘技术的任务
数据挖掘技术并不是仅仅面向特定数据库的简单.检索查询, 而是对大量的数
据从宏观、微观的角度进行统计、分析、综合和推理,进而来指导现实生活中实际问题的
解决,有时还要根据己有的数据展开推理预测。数据挖掘的主要任务是分类、聚类、关 联、序列等。
分类就是在数据中找出一个类别的概念描述,这个概念代表了这类数据的基本信 息,即该类概念的内涵描述,然后根据这种描述建立模型。常用的分类构造 方法主要有统 计方法、机器学习方法、神经网络方法等。其中统计方法包括贝叶斯法和非参数法,机器 学习方法包括决策树法和规则归纳法,神经网络法主要是以BP算法为主。
聚类就是把具有相似性的数据归纳成若干类别,同一类别的数据相似,不同类别的 数据相异,聚类分析可以在分类的基础上进一步建立宏观的概念,进而发现数据的分布 模式。
当两个或者两个以上变量的取值直接存在某种规律性时, 我们就可以称之为
关联。
序列和关联类似,只是把关联中一起发生的项目间关系扩展成一段时间的项目集间 的关系,因此,序列常常被看作由时间变量连起来的关联。 序列的主要作
用是分析长时间的相关记录,进而发现经常发生的模式。
1.2数据挖掘技术的研究现状及发展方向
近年来,随着计算机科学领域的快速发展,数据挖掘技术作为一种新兴的学科,其 研究热度正在逐渐升温,研究的水平也在逐步提高,同时由于国家政府的政策支持与资金 支持,越来越多的数据专业研究者被吸引加入其中。在数据挖掘技术未来的研究过程 中,其主要方向应包括以下几点: (1)参照于SQL语言的
标准化的研究成果,对数据挖掘技术进行形式化的描述,即发现数据语言。 (2)
为实现关于数据额挖掘技术人机交互工作的顺利开展,应满足用户对知识发现过程的可视 化进程。(3)研究在计算机领域的数据挖掘技术的发展, 可以通过数据
挖掘服务器的有效配合的方式实现。
数据挖掘技术是面向应用的。数据挖掘的研究有利地促进了数据挖掘技术应用的发 展与推广。在当今,数据的信息量是非常的庞大的,因为我们所获得的大量的实验数据的 观测如果仅仅是去依靠一些比较传统的分析数据的工具, 是非常
的不靠谱的。所以,对一些具有强大功能且具有自动化的工具的需耍就越来越迫切了,这 很显然的推动了数据挖掘技术的发展,并还在一定的程度之上取得了重要的成果。随着 研究的深入,数据挖掘技术的应用越来越广泛。主耍集中在以下几方面:
(1) 医学领域,随着医院信息系统和健康网站的发展,医疗活动、医学研究和 健康信息行为中的数据被存储下来,形成了海量的健康医疗大数据。这类数据的数据量 大,存储形式多样
您可能关注的文档
最近下载
- 患者身份识别错误应急预案.pptx VIP
- TsaiPress冲模设计软件使用手册.pdf
- 中国红色文化精神 知到智慧树网课答案.pdf VIP
- 道亨软件教学视频-大跨越.pdf VIP
- 第十级 词汇梳理(含英文,中文,音标)-高三英语一轮复习之100天分级突破高考英语词汇.pdf VIP
- 灌肠操作流程及评分标准.docx VIP
- 第八级 词汇梳理(含英文,中文,音标)-高三英语一轮复习之100天分级突破高考英语词汇.pdf VIP
- 基于GEC6818的智能家庭服务系统.doc VIP
- 第七级 词汇梳理(含英文,中文,音标)-高三英语一轮复习之100天分级突破高考英语词汇.pdf VIP
- 火电工程项目执行概算的编制及作用 function & compiling executive budget in thermal power generation engineering.pdf VIP
原创力文档


文档评论(0)