基于改进FP-Growth算法的中药方剂配伍规律挖掘研究.pdfVIP

基于改进FP-Growth算法的中药方剂配伍规律挖掘研究.pdf

此“医疗卫生”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 13卷 第6期 石家庄学院学报 Vo1.13.No.6 2011年 11月 JournalofShijiazhuangUniversity NOV.20l1 基于改进FP—Growth算法的中药方剂配伍规律挖掘研究 董 辉 1,2 (1.合肥工业大学 计算机与信息学院,安徽 合肥 230001; 2.亳州职业技术学院 信息工程系,安徽 亳州 236800) 摘 要:中药方剂即中药复方,是中国中医药实践经验和智慧的结晶,几千年来已积累中药方 剂达十余万首,而如何利用这一巨大的方剂库,开发研制新的安全有效的方剂,是一亟待解决的问 题.数据挖掘技术的出现及利用这一技术对中药方剂配伍规律进行发掘,既能大力推动中国中医信 息化建设,又可快速发现隐含在方剂库中的重要的知识,也能为中医学走向世界提供强有力的技 术支持,因此对中药方剂进行数据挖掘不仅是有必要的,更具有实际意义. 关键词:数据挖掘;关联规则;中药方剂;FP—Growth算法 中图分类号:TP391.1 文献标识码:A 文章编号:1673—1972(2011)06—0063—05 0 引言 中医药学经数千年发展与实践,已形成完整的医疗体系.作为中医药科学核心部分的中药方剂有十余万 首,是中国中医药实践经验和智慧的结晶,载录了中药组方用药的原理、规则和经验技巧,也包含已知和未知 的方剂配伍规律.另外中药方剂的本质特征如整体性、辩证性、动态性等过于抽象,有时也定量和定性的具体 把握,所有这些都需我们继续研究探索.数据挖掘技术的发展与成熟,为研究中药方剂配伍规律等方面提供了 强大的技术支持,发挥了日益重要的作用.关联规则挖掘是数据挖掘非常重要的一种类型,FP—Growth算法是 实现关联规则发挥的经典算法,笔者在分析此算法的基础上,提出FP—Growth算法改进,并用这一算法对中药 方剂配伍规律进行分析挖掘,希望为中国中医药发展和方剂应用提供一定的帮助. 1 关联规则数据挖掘 1.1 关联规则挖掘 数据挖掘是近30年来逐步发展起来的一个新的研究领域。是多学科和技术相结合的产物,被广泛的应 用于政府决策、企业经营、科学探讨和医学研究等各个领域,为促进社会各方面的发展发挥重要的作用.关 联规则挖掘作为数据挖掘的众多知识类型中最为典型的一种。在医学领域有着广泛的应用. 关联规则用于表示OLTP数据库中诸多属性 (项集)之间的关联程度,是利用数据库中的大量数据通过 关联算法寻找属性问的相关性.关联规则挖掘的问题描述如下: 设I={I,I:,...,I)是数据项的集合,D={T。,T,…,Tn)是一个事务数据库,其中每个事务T是数据项集 I的 子集即T I,每个事务T有一个标识符TID与之相关.如果I的一个子集x满足x T,则称事务T包含项 目集 x.一个关联规则就是形如x=Y的蕴涵式,x I、Y I、xnY= .其意义在于一个事务中某些项的出 现,可推导出另一些项在同一事务中也出现,此处,“=”称为 “关联”操作,X称为关联规则的先决条件,Y称 为关联规则的结果.例如:中药方剂配伍中,使用中药A的的方剂,必然有90%以上会同时使用中药 B,则可 用关联规则R表示为R:A=B.支持度 (suppo~)和置信度(confidence)是关联规则中重要的概念. 支持度 (support)是形如在方剂中同时使用中药A和中药B的方剂数占总方剂数的百分比;而置信度 收稿 日期:2011-07—28 基金项 目:安徽省教育厅科研资助 (KJ2011Z259) 作者简介:董辉(1975一),男,安徽亳州人,讲师,硕士研究生,主要从事数据挖掘技术研究 石家庄学院学报 (confidence)是形如同时所有中药A和B的方剂数 占使用中药A的方剂数的百分比称为规则的置信度.前 者用于衡量关联规则在整个数据集中的统计重要性,后者用于衡量关联规则的可信程度,他们的公式分别 为式 (1)和式 (2): Support(A=B)=P(AUB)=B/A,

文档评论(0)

phl805 + 关注
实名认证
文档贡献者

建筑从业资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年05月12日上传了建筑从业资格证

1亿VIP精品文档

相关文档