网络图应用于中医研究的探讨.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大于最小support值的内容筛选出来,这些内容每一条构成一个频繁项集。例如 针对某种疾病治疗的中药用药数据库,寻找用药的频繁项集,设定support值为 20%,通过计算所得到的含有某种药物的频繁项集如表1。 表1 含有一种药物的频繁项集 药物(频繁项集)!在病人中应用的频数占全部病人的比例(%) (茯苓) 2521.000 49.29605 (白芍) 2052.000 40.12515 (当归) 1815.000 35.49081 (柴胡) 1513.000 29.58545 (生甘草) 1411.000 27.59093 (蜜甘草) 1401.000 27.39539 (炒白术) 1397.000 27.31717 (陈皮) 1361.000 26.61322 (大枣) 1314.000 25.69417 (党参) 1 146.000 22.40907 (麦冬) 1060.000 20.72741 表1中的每个频繁项集都只包含了一种药物。由表可以看出,仅就单一一种 1 药,茯苓的用药频数最高;按最小support值为20%,可以从数据库中选出1 种中药。频繁项集方法还可以用于搜索包含两种或多种药物的频繁项集。 1.2关联规则 在得到频繁项集的基础上,可以对频繁项集中内容的关联性进行探讨。每一 j 条关联规则可以表述成“A B”的形式。其中A被称为前项,B被称为后项。 在一般的数据挖掘中,如果A和B符合以下两个条件则生成一条关联规则 Aj 一个频繁项集;(2)在A出现的情况下,B也出现的概率,即confidence值, 大干一个分析者事先设置的底限(最小confidence值)。 相关;lift值越大相关程度越高。 据提取关联规则结果如表2。 表2 部分关联规则输出结果 == Lift 前项 后项 Confidence(%) Support(%) 当归 ==白芍 21.5486960.71625 1.513172 白芍 ==当归 21.5486953.703701.513172 == 20.98162 870 柴胡 自芍 70.91 1.767438 == 20.98162 52.29045 白芍 柴胡 1.767438 == 茯苓 炒白术 21.9006644.426811.626333 == 炒白术 茯苓 21.9006680.171801.626333 由表2可以看出,当归和白芍、柴胡和白芍、茯苓和炒白术三组药support 值都大于20%,表明三组药都被经常一起使用。六条关联规则中confidence值都 大于40%,]1ft值都大干1.5,表明三组药之间有较高的关联度和相关性。 2.网络图的展示 由1.1和1.2所

文档评论(0)

hnlhfdc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档