- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
 - 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
 - 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
 - 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
 - 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
 - 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
 - 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
 
                        查看更多
                        
                    
                The 
The Research on Subspace Clustering for High Dimensional Data
Abstraet
Clustering is an important task of data mining.Nowadays clustering large-scaled and high dimensionaI datasets is a hard and hot issue.Because of data sparsity. eruptY space phenomenon and the curse of dimensionality.it is common for all of the Objects in a dataset tO be nearly equidistant from each other,completely masking the clusters.As the number of dimensions in a dataset increases,distance measures become increasingly meaningless.So traditional clustering methods based on distance similarity can’t perform well.In order to solve these problems,in this thesis we have done some work as follows:
Firstly.because traditional clustering algorithms encounter many difficuries and challenges when dealing with the high dimensional data,we compare the advantages and shortcomings of different dimensional reduction methods.and then conclude that subspace clustering methods are essential and useful.
After further discussing existing subspace clustering algorithms,we find that they can’t work as efficiently as we imagine.The reason lies in that traditional subspace clustering algorithms must scan database many times to discover the subspace of clusters.Moreover,these methods can deal with only single data type.
numerical or categorical data.Sinee we notice the great similarity between subspace and frequent pattern of association rule analysis,this thesis proposes a subspace clustering method based on pattern tree(PSC Algorithm for short).PSC can discover the subspace by scanning the database once.So PSC can improve the
emciency of clustering.Besides.the method can handle both numerical data and
categorical data.Experiments demonstrate that our method significantly improves
on the accuracy and speed of previous methods.
Most clustering models define similarity among different objects by distances over dimensions.However,distance functions are not always adequate in capturing correlations among the objec
                您可能关注的文档
- 律师刑事辩护的执业风险及其防范-法律专业毕业论文.docx
 - 空域图像的自适应和并行加密算法的研究与分析计算机系统结构专业毕业论文.docx
 - 旅游文本中文化负载词的符号学翻译研究-外国语言学及应用语言学专业毕业论文.docx
 - 罗布麻好氧微生物脱胶初探-纺织工程专业毕业论文.docx
 - 美善合一——董仲舒伦理美学思想初探-文艺学专业毕业论文.docx
 - 绿色酯类润滑油的合成及结构性能分析研究-分析化学专业毕业论文.docx
 - 迷走神经刺激治疗药物难治性癫痫的疗效评估-临床医学专业毕业论文.docx
 - 民事上诉审程序研究-诉讼法学专业毕业论文.docx
 - 马克思主义“文艺生产观”新论-文艺学专业毕业论文.docx
 - 黄芪注射液对梗阻性黄疸大鼠血及肝组织中内皮素、一氧化氮含量的影响及意义-外科学专业毕业论文.docx
 
- 空间距离知觉中地表表征的SSIP假说来自空间地表遮挡的证据-基础心理学专业毕业论文.docx
 - 马克思主义与时俱进问题研究-马克思主义理论与思想政治教育专业毕业论文.docx
 - 抗菌肽基因的改造及其植物表达载体的构建-生物化学及分子生物学专业毕业论文.docx
 - 铝酸锶系长余辉发光材料的制备及其光致发光特性研究-材料学专业毕业论文.docx
 - 黄蜀葵查尔酮合成酶基因的克隆-生物化学与分子生物学专业毕业论文.docx
 - 美国股票期权会计准则及其对我国的借鉴意义研究-工商管理专业毕业论文.docx
 - 旅行社企业竞争力研究-旅游管理专业毕业论文.docx
 - 氯沙坦对动脉内皮损伤后基质金属蛋白酶2及其抑制剂表达的影响-心血管内科专业毕业论文.docx
 - 马齿苋提取物治疗急性湿疹的药效研究及作用机理实验研究-中医外科学专业毕业论文.docx
 - 棉纺行业竞争能力分析与TS华新纺织厂改制方案研究-工商管理专业毕业论文.docx
 
最近下载
- 河北旅投集团招聘笔试题库2025.pdf
 - 《急性化脓性胆管炎》课件 .ppt VIP
 - 第11课《百年孤独》-2024-2025学年高二语文同步备课优质课件(统编版选择性必修上册).pptx VIP
 - 人教版历史必修三2016一轮复习第4课明清之际活跃的儒家思想答案.ppt
 - 团体标准《缺血性脑卒中静脉溶栓护理》 (1).pptx VIP
 - DB37T 1389—2024钢箱梁顶推施工技术规范.docx VIP
 - 缺血性脑卒中静脉溶栓护理——中华护理学会团体标准2020.pptx VIP
 - T_CNAS 13-2020 缺血性脑卒中静脉溶栓护理.docx VIP
 - 铁路路基边坡防护施工方案.pptx VIP
 - 10KV供配电工程施工组织设计.doc VIP
 
原创力文档
                        

文档评论(0)