- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
結合模糊集合理論與貝氏分類法之資料探勘技術應用於健保局醫療
結合模糊集合理論與貝氏分類法之資料探勘技術應用於健保局醫療費用審查作業 報告人 資4C 蘇俊瑋 資4C 林政儒 資4C 陳明鈞 資4C 郭挹伶 資4B 羅昊智 研究背景與動機 如何應用資訊科技創造競爭優勢,在資訊密集和創意密集方面,可運用目前在資訊界和企業界中十分受注目的資料探勘和資料倉儲的知識管理技術。 資料探勘技術的主要目標在於,將資料經過處理或解釋轉為資訊,並將資訊運用於決策或驗證,然後累積形成知識,不但能為企業節省成本、提高生產力,也為企業帶來時間競爭力和創意,進而創造競爭優勢。 全民健康保險實施現況 全民健保開辦以來,醫療費用之成長率持續上升,為控制醫療費用於合理的成長範圍內,針對醫療費用支出面,進行相關之監測與控管措施。期望能簡化醫療費用審查之作業流程,並確實提高醫療費用的審查成效。 結合資料探勘中模糊集合理論與貝氏分類法的技術,將能加強資料分類的正確性,以便為健保局節省更多的審查人力與時間,進而提高醫療費用的審查成效,抑制醫療資源之浪費。 研究目的與重要性 利用資料探勘的技術,建立一套分類模式,以協助健保局進行醫療費用審查的工作。 模糊集合理論能彌補貝氏分類法難以處理連續屬性值的問題,發展新的資料探勘技術—模糊貝氏分類法,以簡化計算過程,提高資料分析的正確性。 模糊貝氏分類法將適用於各種分類,甚至是預測的問題,此技術不但應用範圍廣泛,而且能產生可靠的分類規則,提高分類的正確性。 研究流程 文獻探討 資料探勘的定義 「資料探勘是將先前不知道,有效的資訊從大型資料庫抽出的過程,並且將抽出的資訊提供給主管做決定性的決策。」 「由資料庫中,非顯然的、挖掘隱含的、前所未有而可能有用資訊的過程。」 資料探勘的過程 問題的定義 資料收集和整合 建立學習策略 模式的訓練、驗證和測試 結果分析 資料探勘的技術 資料探勘技術的類型 資料探勘的技術 分類是目前最常用的資料探勘類型,常常被用來處理對象篩選的問題。而此類型包括的資料探勘技術有 決策樹 區別分析 貝氏分類法 類神經網路 記憶基礎推理 模糊理論 模糊集合理論 模糊理論〈Fuzzy theory〉實際上是模糊集合、模糊關係、模糊邏輯、模糊控制、模糊量測等理論的泛稱 模糊理論主要是針對人腦這種利用模糊的訊息或是不完全的資料,採用近似推理而不需經過精密繁雜的計算過程,仍能作出正確判斷的特色而發展出來的。 貝氏分類法 貝氏分類法的核心理論是利用貝氏推論來計算案例屬於各類別的機率。而貝氏推論是在不確定情況下進行推測的有效工具,主要方法是利用母數之數種可能的事前分配及實際經驗分配,而推導出母數之事後分配,並藉此計算可能值,期望做到圓滿合理的推測 貝氏分類法利用各類別已知的屬性〈attributes〉機率值及各類別之事前機率,計算新案例於各類別的機率,最後比較各類別的機率,機率最大者則該案例分於此類別。 貝氏分類法 此公式計算的P( cj | v)是指在屬性v 的條件下,案例是屬於cj 類的機率,而P(cj)是指事前機率。且只考量單一屬性 貝氏分類法 若屬性值是連續型態,計算方式則如下 貝氏分類法 貝氏分類法能事先依據研究者經驗,對資料先提出事前機率分配,當資料蒐集完成後,會修正事前機率分配,使之成為事後機率分配 貝氏理論難以決定概似密度函數的問題,若是遇到連續的屬性值,便可先將其進行分割,改成離散屬性值,以易於計算。然而,連續屬性值稍微的變化就會對機率分配造成很大的影響,所以在分割連續數值成為離散數值時,必須特別重視如何分界的問題。 貝氏分類法的特性 能考量所有影響分類結果的屬性 必須假設屬性間各自獨立 允許缺失值的出現 較適合處理離散的屬性值 能清楚判定案例所屬類別,提高分類正確性 對於推得的結果能有明確的解釋 模糊貝氏分類法 針對單一屬性分別描述貝氏推論在離散、連續和模糊屬性值的推論方式 離散或模糊值 模糊貝氏分類法 連續值 研究設計 研究架構 導入模糊貝氏分類法來設計研究之模式,也就是先將連續性數值的資料利用模糊集合理論形成歸屬函數,再結合概似機率得到概似密度函數,若是離散性數值的資料則直接計算其概似機率,最後與事前機率進行整合,並將取得的案例資料分為二部分,一部分的案例資料用來訓練分析模式,另一部分的案例資料用來測試模式的正確性。 研究方法 -建置雛型系統 結合之模糊貝氏分類技術實際建置成系統。較常用來進行系統開發的方法有:系統發展生命週期和雛型法,由於考量系統開發的時間,故本研究採用雛型法來發展系統 利用Microsoft SQL Server 建立資料庫,做為系統之後端,以便管理龐大的醫療費用申報資料,並以Microsoft Excel 來建置雛型系統界面,做為系統之前端,以便使用者有完善的界面可以操作。 研究方法-系統
文档评论(0)