- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在中医药研究中的应用_医学论文
数据挖掘技术在中医药研究中的应用_医学论文
随着医学机构积累的数据越来越多,促进了医学信息包括中医药信息的数字化;如何利用海量信息为防控疾病提供科学依据,总结优化各种诊治方案,已引起业内专家的高度关注。于是数据挖掘技术在中医药研究被日益重视,它将有力促进中医药的现代化进程。
1 数据挖掘的概念、步骤及常用方法
1.1 数据挖掘概念、步骤 数据挖掘(Data mining,DM)即数据库中的知识发现,是从大型数据库的海量数据中提取人们感兴趣的知识,这些知识是隐藏的、事先未知的、潜在有用的信息,挖掘的知识表现为概念、规则、规律、模式等形式[1]。数据挖掘的目的在于使用所发现的模式帮助解释当前的行为或预测未来的结果[2]。挖掘步骤大致有:问题定义、数据提取、数据预处理、数据挖掘、知识评估、结果应用这六步。
1.2 数据挖掘常用方法
1.2.1 描述统计 数据总结的目的是对数据进行从低层次抽象、浓缩到高层次,得出它的紧凑描述。最简单的数据总结方法是描述统计,它包括平均数、中位数、分位数等,它常和统计图配合应用。
1.2.2 关联规则 关联规则从本质上讲是条件概率,即当A发生时、B同时出现的概率有多大?只要B离50%较远就有意义。数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联包括简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时我们并不知道数据库中数据的关联函数,即使知道也不确定。因此关联分析生成的规则带有可信度。
1.2.3 分类和聚类 这是最常用的技术。分类方法主要有:回归、决策树、神经网络。分类分析在数据挖掘中是一项重要任务。分类器的构造方法有统计方法、机器学习方法、神经网络方法等。聚类是根据事物本身潜在的特性研究对象分类的方法。通过聚类把一个数据集合中的个体按照相似性归成若干类别,使其“物以类聚”,将数据库中的记录划分为一系列有意义的子集。聚类要解决的就是实现满足这种要求的类的聚合。在进行聚类前,这些类别是潜在的,可分割的类的个数(聚类数)也是未知的。聚类大致分为统计方法、机器学习方法、神经网络方法和面向数据库的方法等。
1.2.4 偏差检测 数据库中的数据可能有一些异常记录,检测这些偏差很有意义。偏差检测的基本方法是寻找观测结果与参照值之间有意义的差别。
2 中医病历中医学数据挖掘的特点
目前中医病历中采集的中医学信息具有如下特点。
2.1 症状的模糊性 中医学对疾病的诊断是通过望、闻、问、切的四诊合参,获取有用信息,再结合医生的经验,对疾病做出诊断。症状的模糊性不仅表现在获得信息的形式多样,而且因中医症状存在着一症多名,或多症一名的现象,因此不同医生即使对同样的症状,可能会用不同的文字加以描述,比如对“患者不欲进食”的记录,可能会有纳差、食欲不振、纳呆等的不同。这种模糊性模式加大了中医学数据挖掘的难度。
2.2 症状的不完整性 病例和病案的有限性使医学数据库不可能对任何一种疾病信息都能全面地反映出来,表现为医学信息的不完全性。同时,许多医学信息的表达、记录本身就具有不确定和模糊性的特点[3],这方面在中医症状未做出标准量化方法并推行应用之前,尤为突出。疾病信息体现的客观不完整和描述疾病的主观不确切,形成了中医病历中医学信息的不完整性。2.3 证候的复杂性 著名的王永炎院士指出了证候具有动态时空、内实外虚、多维界面的特点,简明扼要的描述了证候的复杂性。中医证候的复杂性给数据挖掘增加了难度,但这也恰好是数据挖掘发挥效力的用武之地。
2.4 治疗信息的个体化特性 中医治病之本是辨证论治,体现在“三因治宜”、“同病异治、异病同治”等方面。即使针对同一疾病相同的证,医生的处方用药也可能会有差异。这种个体化的治疗,充分体现了中医治病的精髓,而其中所蕴涵的深奥哲理和规律,用一般的研究方法难以全面发掘。数据挖掘在这方面很可能会有很高的应用价值。
2.5 挖掘过程的复杂性 中医药领域中的数据属性有离散型的,也有连续型和混合型的,对这些数据的噪声处理等预处理相当复杂,挖掘过程还需要人机交互、多次反复,其中任何一个环节都不能缺少专业人员。只有靠中医药专家的引导,针对具体问题,选择合理的挖掘方法,才能挖掘出真正有价值的知识。
在中医学数据挖掘中,应针对上述数据特点和挖掘目标,结合运用不同的挖掘方法,对非线性、不完全的信息进行智能处理,发挥各自的技术及其整合优势。
3 数据挖掘在中医药研究中的应用
近年来,数据挖掘技术在中医药研究中已得到应用。有学者认为中医药数据挖掘是中医药现代化研究的重要组成部分[4]。
3.1 中
您可能关注的文档
- 携带BRCA1突变的乳腺癌患者B淋巴细胞株对辐射敏感性的初步研究_医学论文.doc
- 携带HGF基因的减毒沙门氏菌对大鼠胃溃疡愈合及CD34表达的影响_医学论文.doc
- 携带人alpha突触核蛋白真核重组质粒构建及其SKNSH细胞表达_医学论文.doc
- 携带人白细胞介素18基因的复制缺陷型腺病毒载体的构建、鉴定和滴度测定_医学论文.doc
- 携载rhBMP_医学论文.doc
- 携载VEGF基因的聚四氟乙烯血管材料对内皮细胞生长的促进作用_医学论文.doc
- 摄入水温度对儿童胃动力的影响_医学论文.doc
- 摄入石榴汁的时间长短对衰老小鼠 抗氧化功能的影响_医学论文.doc
- 支具在特发性脊柱侧凸治疗中的价值_医学论文.doc
- 支原体肺炎患儿自身免疫功能的检测及分析_医学论文.doc
最近下载
- 内蒙古呼和浩特市2024届小升初考试语文试卷含答案.doc VIP
- 八角嫁接育苗技术规程 DB45_T 2091-2019 广西.pdf VIP
- 《海上作战与三十六计》章节及期末答案-海军潜艇学院.docx VIP
- 人工湿地工程施工方案.docx VIP
- 2023广东湛江市检察机关招聘劳动合同制司法辅助人员(32人)笔试备考题库及答案解析.docx VIP
- GBT24353-2022风险管理指南.docx
- 国开电大学习网《高级财务会计》形考任务答案1-5答案.pdf
- 2023-2024学年山东省日照市高一下期末数学试卷附答案解析.docx
- 建筑图集-08J907 洁净厂房建筑构造.pdf VIP
- (正式版)D-L∕T 766-2013 光纤复合架空地线(oPGW)用预绞式金具技术条件和试验方法.docx VIP
文档评论(0)