- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关联规则中医肺癌数据挖掘应用研究
基于关联规则中医肺癌数据挖掘应用研究
【摘 要】收集治疗肺癌的中医药临床文献作为实验数据,运用关联规则技术对中药包含的化学组分进行频繁项集的挖掘,发现了治疗肺癌最主要的药物以及药物之间的依赖关系,对临床肺癌治疗有着重要的作用。
【关键词】数据挖掘;关联规则;肺癌;药物关系
五千年的历史传承下来的中医学是我国宝贵的民族遗产,中医学理论在漫长的临床医疗实践中获得了大量的信息,挖掘出其中一些隐藏的珍贵经验,以此作为临床中医学诊疗的参考依据,保证对症下药,药到病除[1]。数据挖掘能够发现隐藏在海量数据中的潜在知识,是现在最活跃的研究应用领域。关联规则是数据挖掘中的一个重要研究分支,它侧重于寻找数据之间的微妙联系和依赖关系,因此,运用数据挖掘中的关联规则进行中医药领域研究是可行的[2]。
1 关联规则在中医药领域中的发展程度
关联规则技术被提出仅仅20多年时间,许多专家学者对关联规则数据挖掘算法的研究极其关注和重视,与之有关的文献报告的数量也呈现不断上升的趋势,其应用于中医学、中药学领域更只不过近10年左右。这和关联规则技术的特点是息息相关的,它可以通过挖掘频繁项集,得到事务属性之间的关系,应用于中医学、中药学中,能够发现证候、病症以及药物之间,或者方剂配伍中的关系和规律[3]。所以,它无可厚非地成为了中医及中药领域研究中必不可少的应用工具之一。
但总体上讲,关联规则技术在中医和中药研究方面还处于起步阶段,直到2002年应用于中医药领域的文献才第一次出现,进行相关开发研究的机构比较少,主要集中在成都中医药大学、北京中医药大学、中国中医科学院广安门医院。所以关联规则技术在中医药领域的挖掘中还存在众多的问题。比如,方剂学方面,首先,关联规则是基于数据库进行挖掘的,数据库中的数据质量直接会影响到关联规则的结果质量。虽然我国已经建立了众多比较全面的方剂数据库,但是由于方剂数据自身的原因,依然会存在药物名称不统一的问题,大部分的数据是模糊的,数据缺失与冗余并存的问题,尤其在古代文献中更为突出,如何排除数据库中的这些噪声,使整理后的数据更能符合关联规则技术的挖掘的要求已经成为一个大的问题。再比如,在传承和研究老中医医药技术的问题上,也与方剂学方面有着类似的问题,会由于时间太久远或者用药名称不统一的问题导致数据不完整、?失,从而影响挖掘结果,甚至是得不到正确的结果,那么那些宝贵的经验也得不到传承[4]。然而无论怎样,它已经为中医及中药知识的发现打下了基础,因此,随着数据挖掘技术的发展与提高,专家学者对关联规则技术的大量投入与研究,在不久的将来,关联规则会在中医及中药领域创造出辉煌,带给我们意想不到的惊喜。
2 实验数据来源
肺癌原发于支气管黏膜与肺泡,是经常提到的恶性肿瘤,是威胁人类生命的可怕疾病。伴随着环境污染的不断恶化加重,空气质量越来越不好,人们患肺癌的几率呈现上升趋势,给人们的生活与健康带来了严重的影响。此次实验以治疗肺癌的中医药临床文献为基础,结合中药药理实验数据,实验数据源包括《中医临床诊疗文献数据库(肺癌))》和《中药药理实验数据库》,运用关联规则技术挖掘研究治疗肺癌组分中药的新方法,得到有价值的结果。在这1120篇临床文献中,光是治疗肺癌的方剂大约有875篇,占了大部分文献,其中被关注和报道最多的是自拟方,即医生根据病人的不同病症和情况开出的处方,自拟方一共有296篇,这正是中医辨证论治的个体化诊疗特色的体现[4]。目前,中药治疗肺癌主要是“固本”和“驱邪”。用药以抗癌和增强细胞免疫功能为主,辨证论治注重全面调节人体整体功能,同时结合个体差异。
3 关联规则挖掘结果
表1和表2分别是中药包含的化学组分中支持度和置信度出现频次最高的前10位,从中可以看出支持度最高的二项组合前4组是麦冬总皂苷和南沙参多糖、Beta-谷甾醇和南沙参多糖、太子参多糖和南沙参多糖,麦冬多糖和南沙参多糖,实验结果表明在全部同类型的二项组合中它们出现的频次最高。置信度最高的一组是D-甘露醇和肉苁蓉多糖,实验结果表明D-甘露醇出现的时候,肉苁蓉多糖一定出现。另外,还可以看出,20组结果中有13组是包括抗癌活性的化学组分,有6组是具有调节免疫力作用的化学组分,这与中医治疗肺癌主要采取“驱邪”和“固本”的原则相符,用药上以抗癌与增强免疫能力功能为主也是相符的。其他化学组分具有抗炎、抗氧化、酶抑制等作用,都是偏向西医治疗的理论[5]。根据药理作用化学组分,二项组合可以大体上分成两种:一种是化学组分药理作用相同,它们组合在一起加强了药理作用;另一种是化学组分药理作用不同,这样的组合药理作用互相补充。通过关联规则挖掘出的以上结果表明关联规则技术对于中医肺癌的治疗有着重要的作用与影响,它可以发现一些隐含的信息,从信息
原创力文档


文档评论(0)