数据挖掘在中医药领域的应用的研究进展.docVIP

数据挖掘在中医药领域的应用的研究进展.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘在中医药领域的应用的研究进展

数据挖掘在中医药领域的应用的研究进展   关键词:数据挖掘;中医药;应用研究;综述   DOI:10.3969/j.issn.1005-5304.2013.06.052   中图分类号:R2-05 文献标识码:A 文章编号:1005-5304(2013)06-0109-04   数据挖掘是指从大量数据中提取或挖掘有效、新颖、有潜在应用价值和最终可理解的模式、知识,其涉及多学科技术集成,包括数据库和数据仓库技术、统计学、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像处理以及空间或时间数据分析等。数据挖掘技术在中医药研究领域得到广泛应用,兹将近年来研究进展作一综述。   1 中医药文献数据挖掘   中医药文献数据来源主要包括中医药古典、名家医案、验方验案、书刊述评、期刊文献、中药词典等。数据挖掘技术对这些数据整理挖掘,重新展现及总结名家学术思想、辨证论治、中药选材、中药炮制、中药制剂、用药规律等成果,对传承、借鉴与发展起到重要作用。中医药数据具有非线性、模糊性、复杂性、非定量等特征,针对具体的中医药数据和不同的挖掘目标,往往要将几种方法融合起来应用,以发挥各自的技术优势,或引进其他学科方法共同解决一些问题,其中关联规则、频数分析、聚类、文本挖掘等为常用方法。中医药文献数据研究,要求数据来源、文献纳入标准、排除标准、文献规范原则、证候名称规范、症状名称规范、中药名称规范、计量标准规范等进一步加强与完善,数据获取、保存、抽取等预处理及数据挖掘技术的运用也有待更科学深入。   1.1 关联规则   郭氏等[1]采用关联规则分析方法分析了古医籍中治疗带下病的用药规律,发现明清时期治疗带下病的方药以健脾祛湿药物为最常用结构,其中又配伍一些专属度比较高的特色药物,如收涩止带药、补肾药、清热燥湿药等。   1.2 频数分析   吴氏等[2]检索中国期刊全文数据库等1991-2011年发表的有关围绝经期综合征文献,进行整理及频数分析。结果围绝经期综合征常见中医证候有49个,其中肝肾阴虚、肾阳虚、肾阴虚、肾阴阳两虚、心肾不交、肝郁气滞、脾肾阳虚最多见;提取常见症状共65个,包括月经紊乱、头晕耳鸣、失眠、烘热汗出、腰膝酸软、心悸、易怒、纳呆等;病位以肾、心、肝、脾为主;病性以虚为主;脉象以细数、沉细、弦细为主,舌象以舌淡或舌红、苔薄或少苔为主,说明围绝经期综合征的中医证候分布比较集中。   基金项目:国家重点基础研究发展计划(2010CB530602);国家高技术研究发展计划(2012AA02A609);江西省自然科学基金(20122BAB205083)   1.3 聚类分析   姜氏等[3]对文献中代谢综合征(MS)中医辨证分型进行聚类分析和频数统计,表明脾虚痰湿、阴虚热盛、气阴两虚、血瘀脉络、痰淤互结、肝胃郁热、肾阳亏虚是MS的常见证型。   1.4 文本挖掘   黄氏等[4]在中国生物医学文献数据库中收集中医药治疗“肥胖”和“高脂血症”的文献,用文本挖掘研究中医临床用药规律。结果治疗肥胖的常用药物为丹参、山楂、泽泻、黄芪、大黄、茯苓、白术、半夏,其治疗核心药物是黄芪、白术、大黄。治疗高脂血症的最常用药物为丹参、山楂、泽泻、黄芪、大黄、何首乌,其治疗核心药物是丹参和山楂。表明中医治疗肥胖和高脂血症的处方虽有相同之处,但其治疗的核心却大不相同。   1.5 其他方法   周氏等[5]采用频数与关联规则对214例古代郁证医案进行分析,结果涉及药物313种,使用频数最高的药物依次是茯苓、甘草、当归、香附,关联密切的药物组合方为茯苓、当归、白芍、甘草、人参、生姜、柴胡、大枣、白术、郁金、香附、陈皮。郁证医案的用药特点为疏肝健脾、理气活血,符合现行的中医学理论,能为临床提供参考。新方法的引用和多种方法联合使用已相当常见,其他还有支持向量机、Logistic回归、联机分析、关联规则、频数分析、因子分析、主成分分析、聚类分析、神经网络、信息熵、比值法、积分法、Fisher判别分析、Bayes判别分析等。   2 中医诊断学数据挖掘   中医诊断学主要包括中医证候及中医四诊。中医证候系统庞大复杂,研究重点在中医证候分型、中医证候诊断、中医证候诊断标准研究等,中医四诊研究重点在舌诊、脉诊、肤诊、面诊等。研究涉及以上方面的规范化、量化、病-证关系、图像信号处理等,中医诊断正确与否关系到治则用药。数据挖掘技术用于中医诊断学,归纳出中医专家的辨证规律及推理过程,挖掘隐含在其中的知识与规律,丰富专家知识与中医理论,也是中医标准化和客观化的重要手段。   2.1 中医证候   2.1.1 关联规则 刘氏等[6]根据冠心病中医数据的特点,用一种改进的基于向量法的数据关联规则挖掘算法,从脉象、舌质、发病诱因等18

您可能关注的文档

文档评论(0)

fangsheke66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档