- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
优秀毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!
摘要
摘要
当今社会是信息化的社会,信息量急剧.的膨胀,如何从大量数据中用非平
凡的方法发现知识,已经成为信息产业界广泛关注的问题。数据挖掘可以从大
量的信息中发现有用的信息和知识,因此它已成为信息时代的一个研究热点。
聚类分析是数据挖掘中一个重要的研究领域,它的许多研究成果已经被广泛应
用于模式识别、数据分析、图像处理、市场研究等多个领域。聚类边界分析是
聚类分析的一个分支,它在聚类分析、图像检索、虚拟现实等领域中有着重要
的作用。但是目前关于聚类边界点的研究才刚刚起步,并且已有的边界检测的
算法存在着输出结果对输入参数高度依赖、不能准确提取多密度数据集中聚类
的边界点等问题。另外,目前存在的聚类算法和边界检测算法大多数是相互独
立的,没有将聚类和边界检测相融合。
针对现有的边界点检测算法都需要输入参数,但在实际应用中算法的参数
又难以确定这一问题,本文利用边界点自身的分布特征和k-means聚类技术来
自动计算出数据集的边界度阈值,提出了一种无参数边界检测算法NPRIM。
针对现有的边界检测算法在含有任意形状、多密度聚类且不同聚类间距离
较近的数据集上算法精度不高,聚类算法与边界检测算法相互分离等这些问题,
本文充分利用最小生成树和三角剖分图能自然反应数据点分布特征的优点,将
两者结合起来提出了一种新的基于最小生成树的聚类边界检测算法
2.MSTCRIM。
本文实现了算法NPRIM和2-MSTCRIM,在综合数据集和真实数据集上做
了大量实验,并与BORDER、BRIM等其它边界检测算法进行了比较,实验结
果表明:算法NPRIM和2-MSTCRIM均能在包含任意形状、不同大小的多密
度聚类的数据集上有效地检测出边界点。其中,算法NPRIM不需要输入任何
参数,算法2-MSTCRIM在簇与簇之间距离较近的多密度数据集上的检测精度
更高且具有聚类功能。
关键字:数据挖掘聚类边界点参数自动化多密度三角剖分最小生成树
Abstract
Abstract
With informationresourcesis
the of
productiveforces,the
hi曲development
in isainformationhas
society,which society.Italready
rapidlyexpansiontodays
thathowtofind from amount
beentheinformationissue knowledgelarge
industry’S
ofdata non-trivial couldfindusefulinformationand
using way.Datamining
fromthe ithasbecomeahot intheinformation
dataset,50 topic age.
knowledgelarge
Cluster isoneofthemost indata ofwhose
analysis importantpart mining,many
researchresultshavebeen usedin recognition,dataanalysis,image
widely pattern
andotherfi
文档评论(0)