基于数据立方体挖掘疾病–基因–药物新关联.PDF

基于数据立方体挖掘疾病–基因–药物新关联.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于数据立方体挖掘疾病–基因–药物新关联

应用论文 基于数据立方体挖掘疾病–基因–药物 新关联* 魏 星 1, 2 胡德华 1 易敏寒 1 朱启贞 1 朱文婕 2 1( 中南大学信息安全与大数据研究院 长沙 410083) 2(蚌埠医学院公共基础学院 蚌埠 233003) 摘要: 【目的 】在海量文献中, 挖掘并预测生物医学实体之间的新关联, 构建关联网络。【方法】提出一种基于 数据立方体的新方法挖掘疾病–基因–药物间关联, 以糖尿病为例, 构建关联网络, 并使用关联规则量化实体关 1 联程度。【结果】由糖尿病相关疾病(14 种)、基因(23 种)和药物(24 种)构建三个 1-D 方体、三个2-D 方体及其关 v 联网络和一个3-D 方体关联网络, 共计存在411 种关联, 同时得到8 个关联子网。【局限】数据预处理存在主观 5 5 性, 可能会对挖掘结果产生影响。【结论】算法性能优于其他同类算法, 能够为糖尿病精准医疗提供更好的新研 3 究思路。 1 0 关键词: 疾病 基因 药物 数据立方体 关联规则 关联网络 . 2 分类号: TP391 G202 1 DOI : 10.11925/infotech.2096-3467.2017.0641 7 1 0 2 户可以以多维方式, 通过如下钻或上卷这样的联机分 : 1 引 言 v 析处理(OLAP)操作探查数据, 进行数据分析和知识发 i 生物医学文献正在以前所未有的速度增长, 其摘 现, 探索感兴趣的模式。 X a 要中包含了海量的实验结果、基因表型描述和药效信 本文基于数据立方体探查多维空间中的数据, 同 n 息, 整理挖掘其中有效信息, 已成为生物知识发现和 时使用关联规则计算实体间的关联度, 以糖尿病为例, i h 生物医学研究中一个重要手段[1] 。如何才能有效利用 构建糖尿病相关疾病–基因–药物关联网络, 分析并探 c 这些文本中所蕴含的生物医学知识, 无疑对分析海量 讨实体间潜在关联, 突出并挖掘关联网络中的关键节 生物医学数据是非常重要的, 常用方法是通过关键词 点, 提出实验性研究假设, 为研究人员对今后有关糖 直接检索, 但是这只能从大量文档集合中找到用户需 尿病的诊断与治疗、疾病候选基因筛选、靶向药物和 求相关的文件列表, 而不能从文本中直接获取用户感 个性化医疗等研究提供数据支持和新的研究思路。 兴趣的信息。因此, 如何从大规模生物医学文献中自 2 相关研究 动挖掘相关知识是一项迫在眉睫的任务。常见的生物 实体间关联的研究有: 蛋白质与基因的关联[2], 药物 目前与疾病有关的生物医学文本挖掘研究大多集 与药物的关联[3] [4] 中在基因的功能信息上, 如: 对疾病基因和疾病候选 , 药物与疾病的关联 等。 数据立方体(Data Cube)[5]能够存放多个数据维(如 基因的分类排序[6], 使用图论构建疾病与疾病基因关 疾病、基因和药物)上的预计算度量(如关联强度), 用 联度的网络模型[7], 利用定量性框架模型综合分析疾 通讯作者: 胡德华, ORCID: 0000-0001-8027-405X, E-mail: hudehua2000@163.com 。 *本文系国家自然科学基金项目“利用黄鳝性逆转模型探索 piRNA 通路在性别决定中的作用机制”(项目编号: 和安徽省 高校质量工程“医学院校物联网工程专业建设医工融合的实践教学新模式”(项目编号: 2016jyxm

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档