資料群聚性之研究
指導教授: 陳彥良博士
撰寫人: 許昌齡
問題的說明與定義
群聚(clustering)是把有形或抽象的物件歸類到類似物件的類別的過程;將類似物件集合成同群,不同群物件的集合不相似,群聚與分類最大不同是,群聚不預先知道類別標籤,而把資料歸類成新類別[Han 2000]。例如它可透過數學方法來尋找空間物件的相似性,而分析最終目的是將資料進行分類的工作。
群聚方法的典型需求如下[Han 2000]:
需要極少領域知識去決定輸入參數。
有處理不同型態屬性的能力。
高維度。
發現任何形狀群聚。
處理雜值的能力。
延展性:有效率地處理大型資料庫。
可解釋性:透過這模型所能了解和洞察的水準。
限制基礎(constraint-based)群聚。
它有那些的應用
群聚法廣泛地應用在許多領域,例如模式識別,資料分析,和圖像處理。例如市場分析領域,分群基於顧客購買模式 [Han 2000]。
目前的研究現況,有那些議題已經被討論了,結果如何
目前的研究依方法分類有下列五種,茲探討如下:
分割方法(Partitioning)
此種為亦稱非層次化方法,目標通常是將資料分割到類似小組裡,創造分群的集合。K-means[MacQueen67]企圖把一套資料分成子集, 因此在給定的子集之內指向在對其他子集的成員顯著地不同時對彼此有一定程度的相似之處。這樣的子集通常叫作一分群,它優點是很快速。
您可能关注的文档
最近下载
- 《鲁滨逊漂流记》名著导读好书推荐(共27张PPT).pptx VIP
- 建筑工地实习日记40篇.doc VIP
- 男患者导尿术操作评分标准.docx VIP
- 港口道路与堆场施工规范(JTS_T 216-2021).docx VIP
- 高职数学定积分及其应用教学能力比赛教案.pdf
- 高中数学计数原理.pdf VIP
- DB45_T 2562-2022 公路预应力混凝土梁预制技术规范.docx VIP
- 扶梯拆除施工方案.docx VIP
- GB 50058-2014 爆炸危险环境电力装置设计规范.docx VIP
- DB45_T2562-2022_公路预应力混凝土梁预制技术规范_广西壮族自治区 conv.docx VIP
原创力文档

文档评论(0)