- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Apriori算法及欧几里德距离聚类的哮喘方药及治法分析_临床医学论文.doc
基于Apriori算法及欧几里德距离聚类的哮喘方药及治法分析_临床医学论文
基于Apriori算法及欧几里德距离聚类的哮喘方药及治法分析_临床医学论文
作者:张 欢,范欣生,王崇骏,赵凤英,卞雅莉,陶静
【关键词】 哮喘;文献研究;数据挖掘
支气管哮喘是一种复杂的慢性气道炎症,以呼吸困难和喘息反复发作为特征,被世界卫生组织列为四大顽症之一。中医药在哮喘的病因病机、辨证论治、治法方药等方面都积累了大量的临床经验和文献资料,对这些资料进行整理,运用数据挖掘等方法来发现其中深层次的规律和价值,有助于我们更好地对其加以研究与应用。在前期工作中,我们应用关联规则中频繁项集的方法,对古今哮喘方药的配伍规律进行了分析,找到其各自配伍的特点以及两者之间的异同,探讨了临床用药规律的发展变化[1]。现在我们运用基于Apriori算法及欧几里德距离聚类的方法,进一步对哮喘文献中的治法进行分析。
1 资料来源
1.1 数据来源
在《中医方剂大辞典》、《中医方剂数据库》以及现代文献中收集的哮喘方剂的基础上,构建哮喘方剂数据库,建立哮喘方剂数据库和分层聚类与关联的检索形式。通过对近万首方剂的筛选,选择其中对支气管哮喘发作期症状指认度清晰的方剂,进行数据分析。
古方的方源包括《金匮要略》、《诸病源候论》、《备急千金要方》、《外台秘要》、《普济本事方》、《三因极一病证方论》、《玉案》、《寿世保元》、《普济方》、《仙拈集》、《医学集成》、《片玉心书》、《证治汇补》、《惠直堂方》、《医学心悟》、《医方类聚》、《景岳全书》、《幼幼新书》等。今方选自成药处方集、公开发表的临床疗效报道或者医案,如《全国中药成药处方集》、《中国中医急症》、《国医论坛》、《中医药临床杂志》、《中国医药学报》、《实用中医内科杂志》、《中国中医药信息杂志》、《古今名方》、《首批国家级名老中医效验秘方精选》等。
收纳标准:古方选择以治疗“哮”、“哮吼”、“呷嗽”、“喘鸣”等证候或者表现为支气管哮喘症状的方剂为标准;今方选择以具备明确的支气管哮喘的诊断标准、完整的药物组成及剂量、临床病例达25例以上为标准。
排除标准:无药物组成、药物组成不完整、主治证不明确、主治证过于庞杂或针对性不强的方剂均不予收录。
1.2 数据处理
根据《中华本草》对药名进行规范处理,如“甜葶苈”、“苦葶苈”统一为“葶苈子”,“芎·”统一为“川芎”,“云苓”统一为“茯苓”,“苦杏仁”统一为“杏仁”,“麦蘗”统一为“麦芽”,“萝卜子”统一为“莱菔子”,“橘皮”统一为“陈皮”,“京知母”统一为“知母”等。
利用Excel表建立哮喘方药数据库(见表1) 表1 方药输入格式,其中第1列为方名,第1行为药名,方中有该药就在药名下输入1,无该药则输入0。
2 数据挖掘方法
2.1 相关定义
聚类指将数据对象分组成为多个簇,在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。通常采用距离来作为对象间相似度的度量方式,这里运用欧几里德距离,其定义如下:
欧几里德距离越短,说明两个簇之间的相似度越大,而在方剂相似度的比较中,相同的药物越多,两首方剂的关系就越密切。因此,我们同时引进了Apriori算法,提出一种基于Apriori算法和最短欧几里德距离聚类的方法。
算法思路是:求数据集D的最大频繁项集l1 ,然后将数据集D中包含l1的所有事务放进簇C1;将簇C1中的所有事务从数据集D中删除,然后在剩下的数据集上重复以上操作,直至找不到最大频繁项集或数据集为空。
2.2 算法描述
在数据集D中,事务Ti和Tj之间的相似度定义为:
其中,Ti(Ik=1)表示事务Ti在属性Ik上的取值是否为1,为1时Ti(Ik=1)=true,否则Ti(Ik=1)=false。其中数据集算法思路同上。描述如下:
算法:基于最大频繁项集的单层聚类算法
输入:哮喘方剂数据集D
输出:聚类出的类别
① Vector cluster;//存放聚类结果
② Do{
③ 用Apriori算法对整个数据集生成频繁项集,找出满足支持度计数(support Number)的最大频繁项集X[X=(I1,I2,I,In),其中Ij为一条事务的属性]
④ 将包含项集X的所有事务划分到一个类Ci中
⑤ Cluster.add(Ci)
⑥ 将Ci中的事务从数据集D中删去
⑦ While(数据集D不为空并且最大频繁项集X不为空)
⑧ If(数据集D不为空)将剩余的事务归为一类
⑨ Return cluster
3 结果
本研究共搜集治疗发作期哮喘的方剂423首,用药407种,将所有的药物进行聚类。定义共同药物的个数,分别得到以下几种结果。
3.1 8
您可能关注的文档
- 嘌呤受体P2X7激活谷氨酸受体NMDA引起视网膜神经节细胞凋亡_临床医学论文.doc
- 嘌呤核苷酸对慢性海洛因处理大鼠条件性位置偏爱与急性戒断的影响_临床医学论文.doc
- 嘌呤核苷酸对海洛因处理过大鼠C6神经胶质瘤细胞增殖的影响_临床医学论文.doc
- 嘌呤核苷酸补偿对海洛因依赖大鼠痛阈的影响_临床医学论文.doc
- 器官保存液及其分子机制的研究进展_临床医学论文.doc
- 器官移植受者微量CMV DNA与IL-10基因单核苷酸多态性的相关性研究_临床医学论文.doc
- 噬菌体展示技术在肝癌肿瘤血管异质性研究中的应用和优化_临床医学论文.doc
- 噻唑烷二酮类药物对心脏保护作用的研究进展_临床医学论文.doc
- 噻托溴胺粉雾剂对稳定期慢性阻塞性肺病患者运动耐力的影响_临床医学论文.doc
- 囊式野战骨伤急救装置的研制_临床医学论文.doc
- 基于BP神经网络的手势动作表面肌电信号的模式识别_临床医学论文.doc
- 基于CT三维重建技术的腰椎横突间入路解剖学研究_临床医学论文.doc
- 基于CT医学图像的边缘提取研究_临床医学论文.doc
- 基于Delphi法建立慢性心力衰竭诊疗方案及其结果分析_临床医学论文.doc
- 基于DRSP的经前期综合征肝气逆证疗效评价参考标准的建立_临床医学论文.doc
- 基于FPGA的快速DCT医学图像的压缩算法_临床医学论文.doc
- 基于FPGA的编码超声发射系统的设计_临床医学论文.doc
- 基于H.264标准的双目立体视频压缩编码与实现_临床医学论文.doc
- 基于HEV中和表位的基因免疫诱导特异性抗体及中和作用研究_临床医学论文.doc
- 基于HL7协议的健康信息智能咨询系统的设计_临床医学论文.doc
文档评论(0)