- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
k最鄰近演算法應用於帕金森氏病患者之鑑別分析.pdf
2013福祉科技與服務管理研討會
k最鄰近演算法應用於帕金森氏病患者之鑑別分析
*
楊偉修
南開科技大學企業管理系
1. 研究背景與目的
帕金森氏病(Parkinson’s Disease, PD是老年人中常見的一種神經系統退化性疾病,症狀表現相)
當複雜且與其他多種疾病的症狀相似,因此如何有效且準確的區分該疾病,則成為本研究的主要
目的。 近年來,許多學者已成功地將資料探勘技術應用於醫學領域上,其中以帕金森氏病為研究
主題的,有Little 針對大部分PD患者可能發生的言語障礙,進行發音量測實驗 (Little, et al., 2009) 。
之後有些學者運用該資料集,以類神經網路方法進行病例鑑別(Ene, 2008) 、粗糙集法進行特徵屬性
選取分析、以及 Das 於2010 年同時比較四種分類方法之準確性等(Das, 2010) 。
k最近鄰演算法(k Nearest Neighbor Algorithm, kNN是一種非常簡單且直覺化的樣式辨識方法,)
由於該法操作簡單,所以已廣泛且有效的應用於各種領域之辨識問題上。但 kNN演算法從發展至
今,一直存在兩個問題,一個就是必須儲存大量的訓練樣本,另一個則是無法準確的決定最佳 值。
k
為解決上述問題,已經有許多學者致力於樣本篩選或特徵篩選以期減低儲存空間,目前已有許多
方法可以有效的解決此種問題。然對於如何決定最佳 值,至今仍無具體且有效的方法可以處理,
k
k k 3 N
因此有關 kNN 法的研究,大多是任意選擇 值進行計算,如預先選定 或 k N ( 為資料
k
數) (Bhattacharya, et al., 2012; Yang, et al., 2012) 。但是值的選取,絕對會影響 kNN演算法的執行
k
結果,分類過程中如能以真正的最佳 值進行計算,則可以建立高準確率的分類模型。此外,以不
同的距離函數計算,亦會產生不同的準確率,因此亦有很多學者發展出各種不同的距離函數以提
升kNN演算法的準確率。有鑑於此,本研究預先將資料以四種不同的資料正規化法處理,再分別
k
以常用的歐幾里得距離與曼哈頓距離進行計算,分析每種情況下各種 值的準確率變化情形,以期
建立簡易使用且具高準確度的 kNN 分類模型。
2. 研究方法
本研究所使用的實驗資料,是取自Little所建立的帕金森氏病資料集。該資料集是針對 31位
46~85 歲(平均年齡約為65.8 歲,標準差為9.8 )的病人(其中有23位是屬於確定病患),藉由
生物醫學的儀器設備,花費約28 年時間,針對每位病人進行約六次的發音測試,並紀錄測試結果
而得。資料集中共有195筆記錄, 22個輸入屬性為連續性資料,與一個類別標記屬性 status (或稱
為輸出屬性),status的值有 0 與1 兩種,當status=1時表示為確定病例。
k最近鄰法是一種非常簡單又容易操作的分類演算法,在資料探勘的研究中又有學者稱其為懶
惰學習法或非參數估計的機器學習方法。本研究中先使用四種常用的資料正規化方法:極值正規
v
化將值標準化為 [0, 1]範圍、 Z-分數正規化、最大正規化與十進位正規化,將某維度中
文档评论(0)