- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络工程毕业设计(论文)_PAM聚类算法的分析与实现
PAGE
- PAGE 1 -
毕 业 论 文(设计)
论文(设计)题目:PAM聚类算法的分析与实现
系 别:
专 业:
学 号:
姓 名:
指导教师:
时 间:
毕 业 论 文(设 计) 开 题 报 告
系别:计算机与信息科学系 专业:网络工程
学 号
姓 名
论文(设计)题目
PAM聚类算法的分析与实现
命题来源
eq \o\ac(□,√)教师命题 □学生自主命题 □教师课题
选题意义(不少于300字):
随着计算机技术、网络技术的迅猛发展与广泛应用,人们面临着日益增多的业务数据,这些数据中往往隐含了大量的不易被人们察觉的宝贵信息,为了得到这些信息,人们想尽了一切办法。数据挖掘技术就是在这种状况下应运而生了。而聚类知识发现是数据挖掘中的一项重要的内容。
在日常生活、生产和科研工作中,经常要对被研究的对象经行分类。而聚类分析就是研究和处理给定对象的分类常用的数学方法。聚类就是将数据对象分组成多个簇,同一个簇中的对象之间具有较高的相似性,而不同簇中的对象具有较大的差异性。
在目前的许多聚类算法中,PAM算法的优势在于:PAM算法比较健壮,对“噪声”和孤立点数据不敏感;由它发现的族与测试数据的输入顺序无关;能够处理不同类型的数据点。
研究综述(前人的研究现状及进展情况,不少于600字):
PAM(Partitioning Around Medoid,围绕中心点的划分)算法是是划分算法中一种很重要的算法,有时也称为k-中心点算法,是指用中心点来代表一个簇。PAM算法最早由Kaufman和Rousseevw提出,Medoid的意思就是位于中心位置的对象。PAM算法的目的是对n个数据对象给出k个划分。PAM算法的基本思想:PAM算法的目的是对成员集合D中的N个数据对象给出k个划分,形成k个簇,在每个簇中随机选取1个成员设置为中心点,然后在每一步中,对输入数据集中目前还不是中心点的成员根据其与中心点的相异度或者距离进行逐个比较,看是否可能成为中心点。用簇中的非中心点到簇的中心点的所有距离之和来度量聚类效果,其中成员总是被分配到离自身最近的簇中,以此来提高聚类的质量。
由于PAM算法对小数据集非常有效,但对大的数据集合没有良好的可伸缩性,就出现了结合PAM的CLARA(Cluster LARger Application)算法。CLARA是基于k-中心点类型的算法,能处理更大的数据集合。CLARA先抽取数据集合的多个样本,然后用PAM方法在抽取的样本中寻找最佳的k个中心点,返回最好的聚类结果作为输出。后来又出现了CLARNS(Cluster Larger Application based upon RANdomized search,也称随机搜索聚类算法),CLARNS是另外一种k-中心点方法,它将采样技术和PAM结合起来,对CLARA的聚类质量和可伸缩性进行了改进。不像CLARA那样每个阶段选取一个固定样本,CLARANS在搜索的每一步都带一定随机性地选取一个样本。
研究的目标和主要内容(不少于400字)
对PAM聚类算法的基本思想、PAM聚类算法的替换代价和PAM聚类算法的性能等进行分析,根据PAM算法描述,使用matlab软件编写PAM聚类算法代码,实现PAM聚类算法。使用编写好的代码运用到一个实例中,使同一个簇中的对象越近越好,而不同簇中的对象越远越好,对实例中的数据进行聚类后,把聚类后的结果作为进一步进行分析的基础。
本选题研究的主要内容如下:
(1)PAM聚类算法的分析,分析PAM聚类算法的主要内容如下:
PAM聚类算法的基本思想:了解PAM聚类算法的基础,能够让人简单的了解PAM聚类算法的整个过程,对于最后的算法实现有很重要的意义。
PAM聚类算法的替换代价:分四种情况计算替换代价,通过最后的总代价,来分析是否要进行替换的根据。
PAM聚类算法的算法描述:使用matlab软件编写PAM聚类算法的代码的根据。
PAM聚类算法的性能:包含了PAM聚类算法的优点和缺点。
(2) PAM聚类算法的实现,实现PAM聚类算法的主要内容如下:
算法实现:根据PAM聚类算法描述,使用matlab软件编写PAM聚类算法代码。
把编写好PAM聚类算法的代码运用到一个实例中。
拟采用的研究方法
在指导老师的指导下,查找并阅读相关资料,利用相关资料对PAM算法进行详细分析,从而根据分析实现PAM算法。使用matlab软件来编写代码。
研究工作的进度安排
2010年11月20号-1
您可能关注的文档
- 福利中心六位一体;35#塔吊安装拆除方案.doc
- 票务易购系统之火车票板块毕业设计(论文).doc
- 福伊特造纸(中国)有限公司扩建工程联合厂房钢结构工程钢结构吊装施工专项方案.doc
- 福合石矿新建年产8万立方米花岗岩开采项目可研报告.doc
- 福建xx(国际)农产品物流城项目可行性研究报告28195.doc
- 福州世茂国际中心酒店洗衣房设备供应及安装工程投标文件(技术标).doc
- 福建永隆新材料科技有限公司新建年产6万吨PBT纤维直纺工程项目环境影响报告书.doc
- 福建移动综合业务(社区)推广整体解决方案.doc
- 福建海源自动化(建材)机械设备有限公司尽职调查报告.doc
- 禽业合作社菜篮子;生产畜牧项目申报书.doc
- 网络工程毕业设计(论文)_信息、知识、智能的转换和算法分析.doc
- 网络工程毕业设计(论文)_基于ACL的校园网络安全策略.doc
- 网络工程毕业设计(论文)_基于Binary Trie的IP地址查找算法研究与实现.doc
- 网络工程毕业设计(论文)_基于BS模式的中小企业人事管理系统的设计与实现.doc
- 网络工程毕业设计(论文)_基于GPRS远程安防监控系统的设计与实现.doc
- 网络工程毕业设计(论文)_基于BS结构的旅游网站的开发与设计.doc
- 网络工程毕业设计(论文)_基于智能网全软件工具的网络安全技术研究.doc
- 网络工程毕业设计(论文)_天津冶金职业技术学院综合布线系统及相关设备安装施工实施方案.doc
- 网络工程毕业设计(论文)_基于遗传算法的高校排课系统设计实现.doc
- 网络工程毕业设计(论文)_长白山自助游网站设计与实现.doc
原创力文档


文档评论(0)