- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
医学论文:关联规则在中医药领域的应用研究.doc
????????????? 作者:童元元,赵英凯,于静,胡艳敏,潘艳丽【关键词】? 数据挖掘;关联规则;中医药;文献分析数据挖掘又称数据库中的知识发现,是随着数据库和人工智能发展起来的一门新兴技术,是从大量数据中发现有效的、新颖的、潜在有用的并且最终可理解的知识的过程1。利用数据挖掘技术进行中医药海量数据的知识发现,对中医药的继承发展具有现实意义。 ??? 关联规则(association rules)是数据挖掘的重要研究方法之一,由r.agrawal等人2于1993年首先提出,用于从大量数据中发现满足一定条件的项集之间隐藏的关联。其中,关联有简单关联、时序关联、因果关联。关联规则的挖掘一般分成两个子问题:找出所有支持度≥最小支持度阈值的频繁项集;由频繁模式生成满足可信度阈值的关联规则。笔者旨在通过对以关联规则为主要方法进行中医药研究的文献报道进行整理分析,寻找关联规则应用于中医药研究的特点、规律,以期为相关研究人员提供参考。 1? 资料与方法 1.1? 检索源 ??? 以中国中医科学院中医药信息研究所的《中医药期刊文献数据库》(1949-2008年),以及中国医学科学院医学信息研究所的《中国生物医学文献数据库(cbm)》(1978-2008年)为检索源(注:2008年为不完全收录)。 1.2? 检索策略 ??? 检索入口选取“关键词”、“篇名”、“主题词”、“摘要”,检索式为“关联or apriori算法or频集算法or购物篮分析”进行检索。 1.3? 统计方法 ??? 获取检索题录的全文,排除重复、综述性文献和非中医药研究文献。提取文献的发表年份、机构等内容录入access数据库,进行数据处理,并对关联规则的具体应用情况进行分析。 1.4? 分析内容 ??? 分别对文献的年度分布、机构发文量、资助情况、算法使用、研究内容等进行统计分析,进一步分析关联规则在中医药领域的应用情况。 2? 结果与分析 2.1? 文献量 检索得到以关联规则为主要研究方法的中医药文献共44篇,文献量呈逐年递增走势(见表1)。其中属于评述性文献5篇,应用性文献39篇。注明接受立项资助的文献35篇(见表1)。表1? 各年度文献量及资助情况(略) 2.2? 机构分布 ??? 根据文献第一作者所在机构统计,发文量居前3位的单位分别是:成都中医药大学,发文6篇,占总文献的13.64%;北京中医药大学,发文5篇,占11.37%;中国中医科学院广安门医院,发文4篇,占9%。发文2篇以上的单位有10个,发文31篇,占所有文献的70.45%。 2.3? 关联规则应用情况??? 在44篇文献报道中,注明所采用具体算法的文献17篇,其中应用apriori及apriori改良算法的报道13篇;fp-growth算法4篇。以关联规则作为唯一研究方法的文献16篇,与其他方法联合应用的文献28篇,其中,两种方法联用的研究17篇,3种或3种以上方法的11篇,在与关联规则联合使用的方法中,应用最多的为频数分析和聚类分析。??? 文献分析发现,关联规则应用最多的研究依次为:药物之间;症之间;药与症、证、病以及症证之间;病因、病机、病位、治法与药之间(见表2)。此外,尚有进行中药不良反应影响因素3及中医药效、植物科属、化学成分的活性、中药提取物现代药理等数据维间关联规则挖掘的研究4。表2? 关联规则使用情况(略)注:*包含2篇关于中医症状与西医生物学指标之间的关联研究 3? 讨论 3.1? 关联规则在中医药领域的应用尚处于起步阶段?? 关联规则于1993年提出,至2002年应用于中医药领域的文献首次出现,之后,虽然文献量呈逐年增长趋势,但总的说来,关联规则在中医药领域的应用尚处于起步阶段,而且,进行相关研究的机构较少,主要集中于成都中医药大学、北京中医药大学、中国中医科学院广安门医院。 3.2? apriori算法为主要应用算法 ??? 关联规则常见的算法包括apriori算法、fp-growth算法等。其中,apriori是一种找频繁项集的基本算法,是关联规则的经典算法,现在大部分的算法都基于该算法的框架。本研究发现,在中医药领域多采用经典apriori或者其改良算法。 3.3? 关联规则在中医药研究中的应用热点集中于方剂配伍规律的挖掘??? 目前关于关联规则在中医药领域的研究多侧重于方法应用,热点则主要集中于方剂配伍规律、用药特点的发现,具体有以下方面。①用于药物配伍的研究5-6。例如姚氏等5以数据挖掘系统enterprise miner为平台,对治疗消渴的中药复方在单味药、2味药、3味药层次上进行了药物组成之间的关联模式研究,结果在一定程度上反映出历代中医在消渴治疗方面认识和治疗的整体规律性。用于方-证、药-证的关联研
文档评论(0)