- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2011年中国卫生统计学年会论文集
基于自发呈报系统的关联规则挖掘技术对信号检测的研究‘
于超1孙弧林1吴骋1许金芳1叶小飞1钱维1杜文民2贺佳1△
摘要背景自从白发呈报系统(SRSs)建立以来,检测药品不良反应信号的方法逐日增多。
如今众多方法虽已成熟但仍各有利弊,本研究目的就是探索一个新的数据挖掘算法——关联规则
(AR),观察并展示其在监测药品安全性中的应用。方法本研究应用蒙特卡罗模拟方法随机的产生
单个药物导致的不良事件报告。再用AR连其他同其他四种现行的算法备臼挖掘并对结果进行比较。
另外,我们还对上海市2009年的SRSs采朋AR算法,并展示它的可行性。研究中使用的所有算法
通过SAS
9.1,3软件实现。结果蒙特卡洛模拟方法平均共产生108337个报告。AR与其他算法相比
应检测中心发布的通报信息,AR对09年上海市的报告检出了570个可疑关联。其中包括国家药品
际数据中都是一个有效的信号检测算法,并且其较好的灵敏度也保证了发现罕见可疑信号的能力。
本文尚有不足,还需对此方法进行更深入的研究。
关键词关联规则数据挖掘自发呈报系统药物警戒
药物警戒学(PHV)与人类的健康和医疗卫生密切相关,如今已经越发被人们所重视。PHV的
定义是:“它是一个有关于检测,评价,理解和预防不良效果或任何其他约品相关问题的活动和学
科。”【¨。PHV的关键是去收集和分析药品安全性的数据并获得有力的结论。由于动物实验数据和
临床试验的缺陷,为了获得完整的药品信息描述,上市后药品安全性的监测在PHV工作中将会是一
个重要的部分。应用在信号检测的主要的数据集是自发呈报系统(SRSs)。尽管中国的PI-W尚未成
增加。然而,对于监管药品安全的专家来说,从庞大的数据库中去鉴别常见的或严重的药品.不良事
件报告是不可思议的。而且,尽管SRSs对大规模数据有很高的效能和可行性,但药品不良事件在整
个人群中的背景发生率和病人对于药品的暴露率都无从知晓,更不用说缺失数据、随着时间推移报
告模式的改变、重复报告、报告质量不稳定等问题lZJ。
因此,我们急需一个有效的信号检测方法。英国药品与保健产品管理局和其他不良反应监测中
简单直观,对信号检测:I:作有很大的帮助【41。国际药品检测WHO合作中心(乌普萨拉监测中心)基
于贝叶斯理论发展了一种新的方法,叫做贝叶斯置信增值神经网络算法(BCPNN)[510这种方法经
证明也是一种应用在ADR信号检测中极其有用的方浏61。美国食品药品监督管理局(FDA)则应
用多重伽马泊松分布收缩法(MGPS)在大量频数表中挖掘信息[7.8l。然而每种方法都是有利有弊,
因为没有一个统一的金标准,我们无法充分的评价这些方法的性能优劣。
上述提到的所有这些分析方法都是基于一个基本的2x2频数表的比例失衡分析法。通过比较人
们服用某种药品导致的某不良反应与服用其他药品的某不良反应,就可以将发现的不成比例的报告
,国家自然科学基金资助;上海市优秀学科带头人计划(A类)(09xDl405500)
1.第二军医大学卫生统计学教研室(200433)
2.上海市药品不良反应监测中心(200040)
△通讯作者:贺佳教授,E-mail:hejia63@yahoo.COrn.
242
2011年中国一卫生统计学年会论文集
作为信号。但由于对照组一直处于变动的状态,用比例失衡方法来分析SRSs数据可能不是最合适的。
在此,我们正试着采用关联规则(AR)数据挖掘技术作为一种新的信号检测方法,并应用模拟数据
的形式来证实它的可行性。
理论和方法
1.关联规则挖掘技术
Retc.
数据挖掘是指应用统计方法来处理火型数据库,目的是发现新的信息【孔。 AR是Agrawal
在1993年首次提出,迄今为止是知识发现领域中最重要的数据挖掘技术之一,其主要用在辅助市场
决策中吼基本理论描述如下:
,={‘,之,…,‘)是一个项目集的集合。设任务相关的数据集D是数据库事务的集合,其中每个事
务T是项的集合,使得T∈I。关联规则提供了一个以“if-then”形式的语句,例如,如果一个孕妇服
用了利沙度安,那么她们
文档评论(0)