- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
可视化数据挖掘
赵星 淮晓永 熊范纶
(中置科学院舍肥智能机械研究所台肥230021)
’
摘 要
可视化数据挖掘是当前数据挖掘的研究重点之一,本文首先总结了雹际上近几年发展起来的凡类
’
可视他数据挖掘技术,然后提出了把计算机图象处理技术应用于可视他数据挖掘.为可规化数据挖掘
提供了一十新思路.
关键词致据库中的知识发现,数据可视化,可视化大型多维数据库
中图法分类号TPl81.TP391.77
1引言
数据库中的知识发现(ZDD)是当今国际人工智能最富活力的新兴研究领域。数据挖掘
Data
一个重要手段.可视化数据挖掘(Visual
可视化数据挖掘是指把数据库中的数据用图尼表示,从形成的数据闰彤中发掘数据库中的
一些正确、新颖、有潜在直用价值和最终可理解酌模式(知识)。
我们旱已熟悉一些数据显示技术,如:柱形图、条形图、折线图、散点图、面积图、圆环
图趴及曲面图、股价图等。但这些显示技术不适台可视化大型多维数据库.
可视化数据挖掘有以下几个优点:
I)在数据预处理阶段,用可视化技术来显示有关数据,可对数据有一个初步的宏观的理解,
为较好地选取数据和确定数据挖掘方向打下基础。就象在一个陌生的城市寻找~个地方,酋先找
~幅地图,整体浏览一下,辩清大致的方位,然后再根据所找地方的一些特征(如所在街道名、
门牌号码等)寻找。
2)在数据挖掘阶段,选用适合领域问题的可视化技术形成数据图形,可帮助用户通过观察
数据图形方便直观地发现有用模式,甚至是一些目前非可视化技术不能发现的有用模式。
3)在结果表示阶段.也可用可视化技术。俗话说:“一幅图能顶一千句话”,把发现的模式
进行可视他,会帮助用户理解,尤其是对非专业人士。如在数据挖掘中,典型的知识表示为
“if…then…”规则,相同的知识能很方便地用图形表示出来。
4)用户通过可视化数据挖掘进行交互式数据挖掘,在及时反馈回的数据图形的引导下,快
速从数据中发现知识.
由此可见.可视化在数据挖掘的各个阶段都可起重要的作用。由于可视化数据挖掘有上述
优点,可视化数据挖掘技术发展迅速,目前大多数商业性数据挖掘和分析系统都应用了一种或多
‘本谭题受圈家茸拣基金重点项目资助
收稚日期:1999-0S-)1
独立于查询的可视亿技术根据某些属性顺序摊列数据,并用
示器上。这类可视化技术包括空间填充曲线技术(Space—Fill
(EecursivePattera
Technique)“等。
,下面举一个例子来说明递归模型技术.
雾 , 礞定在六天中,每天测九次,每次测九个数据,由这些数据
囊臻羲碧睐从这个数据集合中发掘知识·那么-数据的这种内在的结构(模式)——瓣舔土柏荚 ~!
篓 ’一 壹
茎。
142 模式识别与人工智能 12枯
系,最好能够表现出来,递归模型可视化技术可很好地作到这~点。首先把每次测得的九个数据
捧成一个小‘s’形状,三个一排。接着把每天测得的数据(共9x9个数据)捧成一个3x3的方
形,然后依次排列六天的数据。这样很容易从形成的图形上看出数据I蘸着时间的变化情况。如图
I所示.
1 2 3
己己己己己己己己己
己己己
文档评论(0)