数据挖掘的新趋势可视化数据挖掘论文.pdfVIP

下载本文档

14
0
约7.03千字
约 5页
2017-06-27 发布于广东
举报
版权申诉

数据挖掘的新趋势可视化数据挖掘论文.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第二十届全国计算机信息管理学术研讨会数据挖掘的新趋势：可视化数据挖掘北京大学信息管理系刘波徐学文 (北京市122信箱6分箱，北京，100036) 【摘要】本文通过分析可视化技术与数据挖掘技术的区别与联系，指出了把可视化技术引入数据挖掘过程产生的优势，同时清晰的指出了数据可视化、传统数据挖掘和可视化数据挖掘的区别。在分析可视化数据挖掘现状的基础上，从定量和定性的角度，给出了可视化数据挖掘的定义，构建了可视化数据挖掘的体系结构框架，分析了可视化数据挖掘的发展方向，为进一步研究可视化数据挖掘打下了基础。【摘要】数据挖掘，可视化，可视化数据挖掘+ 伴随着信息爆炸的出现，面对浩瀚如烟的信息和数据，为了从大量的数据中提取出对人们的生活和科技发展有用的信息，各种数据处理方法应运而生。数据挖掘技术则是其中的典型代表，它成熟的理论方法为发现显性信息背后隐藏的隐性知识提供了强有力的技术依据。然而，美中不足的是数据挖掘是一门多学科的交义技术，它是在统计学、数据库和人工智能等学科的基础上发展起来的，数据挖掘算法本身都相当复杂，所以一般的用户难以理解和接受。为弥补数据挖掘算法复杂性的缺陷，把可视化技术引入到数据挖掘中，由此产生了可视化数据挖掘技术。可视化数据挖掘充分利用可视化的直观性，从可视化角度分析和理解数据挖掘的全过程，最大限度的弥补了数据挖掘算法复杂性这一缺陷。 1可视化技术与数据挖掘技术 1．1可视化各个领域的专家学者从不同的角度给了可视化多种定义，就目前而言，我们很难给可视化一个统一的定义。当前，关于可视化的定义，比较有代表性的有以下两种。可视化是一种计算和处理的方法，它将抽象的符号表示成具体的几何关系，使研究者能亲眼看见他们所模拟和计算的结果，使口技术(Grinstein)12]。 1987年2月，美国国家科学基金会在华盛顿召开了有关科学计算可视化的首次会议，在这次会议上，以科学计算可视化为名首次提出了可视化的概念。这次会议以后，可视化迅速成为人们研究的热点，并逐步从科学计算可视化延伸到信息可视化，从单纯的科学计算数据扩展剑其他领域的多种数据。从1995年以来，在美国和英国分别举行每年一届的信息可视化会议，组织有关专家、学者专门讨论可视化问题。虽然可视化的概念于1987才正式被提出，然而事实上可视化并不是一个全新的概念，早在许多年前，人们已经开始不自觉的使用可视化这种方式理解生活中出现的问题。可视化从被正式提出，发展到今天，虽然只经历了短短的二十年，但是已经形成较为完善的理论基础。在本文，笔者不打算花大量的时间具体分析可视化的理论技术，在此只强调一点，可视化充分借鉴了“一图胜千言” 作者简介：刘波，北京大学信息管理系博士生。E-mail：hope—lb@yahoo．corn．ca 241 第二十届伞国计算机信息管理学术研讨会的思想，借助形象的图形表达抽象的数据，有效的提高了人的认知能力，是～种强有力的信息理解工具。 1．2数据挖掘数据挖掘是从大量的数据中挖掘出有用的信息，即从人量的、不完全的、有噪卢的、模糊的、随机的数据集中发现隐含的、规律性的、人们事先未知的，但又是潜在有用的并且最终可理解的信息和知识的非平凡过程{3l。它是一门涉及面很广的交叉学科，包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等有关技术。数据挖掘的基本处理过程包括：数据准备、数据挖掘和结果的解释评估。根据数据挖掘的方法分，可粗分为：机器学习方法、统计方法、神经网络方法和数据库方法。机器学习方法包括：归纳学习方法(决策树、规则归纳等)、基丁范例的推理 CBR、遗传算法、贝叶斯信念网络等。统计方法包括：同归分析(多元同归、白同归等)、判别分析 (贝叶斯判别、费歇尔判别、非参数判别等)、聚类分析(系统聚类、动态聚类等)、探索性分析(主元分析法、相关分析法等)、以及模糊集、粗糙集、支持向量机等。神经网络方法包括：前向神经网络(BP算法等)、白组织神经网络(自组织特征映射、竞争学习等)等。数据库方法主要是基于可视化的多维数据分析或OLAP方法和面向属性的归纳方法。 1．3可视化与数据挖掘技术的区别与联系通过表1[3】[4】[51对可视化与数据