- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于数据立方体挖掘疾病–基因–药物新关联
应用论文
基于数据立方体挖掘疾病–基因–药物
新关联*
魏 星 1, 2 胡德华 1 易敏寒 1 朱启贞 1 朱文婕 2
1( 中南大学信息安全与大数据研究院 长沙 410083)
2(蚌埠医学院公共基础学院 蚌埠 233003)
摘要: 【目的 】在海量文献中, 挖掘并预测生物医学实体之间的新关联, 构建关联网络。【方法】提出一种基于
数据立方体的新方法挖掘疾病–基因–药物间关联, 以糖尿病为例, 构建关联网络, 并使用关联规则量化实体关
1 联程度。【结果】由糖尿病相关疾病(14 种)、基因(23 种)和药物(24 种)构建三个 1-D 方体、三个2-D 方体及其关
v 联网络和一个3-D 方体关联网络, 共计存在411 种关联, 同时得到8 个关联子网。【局限】数据预处理存在主观
5
5 性, 可能会对挖掘结果产生影响。【结论】算法性能优于其他同类算法, 能够为糖尿病精准医疗提供更好的新研
3 究思路。
1
0 关键词: 疾病 基因 药物 数据立方体 关联规则 关联网络
.
2 分类号: TP391 G202
1 DOI : 10.11925/infotech.2096-3467.2017.0641
7
1
0
2 户可以以多维方式, 通过如下钻或上卷这样的联机分
: 1 引 言
v 析处理(OLAP)操作探查数据, 进行数据分析和知识发
i 生物医学文献正在以前所未有的速度增长, 其摘 现, 探索感兴趣的模式。
X
a 要中包含了海量的实验结果、基因表型描述和药效信 本文基于数据立方体探查多维空间中的数据, 同
n 息, 整理挖掘其中有效信息, 已成为生物知识发现和 时使用关联规则计算实体间的关联度, 以糖尿病为例,
i
h 生物医学研究中一个重要手段[1] 。如何才能有效利用 构建糖尿病相关疾病–基因–药物关联网络, 分析并探
c 这些文本中所蕴含的生物医学知识, 无疑对分析海量 讨实体间潜在关联, 突出并挖掘关联网络中的关键节
生物医学数据是非常重要的, 常用方法是通过关键词 点, 提出实验性研究假设, 为研究人员对今后有关糖
直接检索, 但是这只能从大量文档集合中找到用户需 尿病的诊断与治疗、疾病候选基因筛选、靶向药物和
求相关的文件列表, 而不能从文本中直接获取用户感 个性化医疗等研究提供数据支持和新的研究思路。
兴趣的信息。因此, 如何从大规模生物医学文献中自
2 相关研究
动挖掘相关知识是一项迫在眉睫的任务。常见的生物
实体间关联的研究有: 蛋白质与基因的关联[2], 药物 目前与疾病有关的生物医学文本挖掘研究大多集
与药物的关联[3] [4] 中在基因的功能信息上, 如: 对疾病基因和疾病候选
, 药物与疾病的关联 等。
数据立方体(Data Cube)[5]能够存放多个数据维(如 基因的分类排序[6], 使用图论构建疾病与疾病基因关
疾病、基因和药物)上的预计算度量(如关联强度), 用 联度的网络模型[7], 利用定量性框架模型综合分析疾
通讯作者: 胡德华, ORCID: 0000-0001-8027-405X, E-mail: hudehua2000@163.com 。
*本文系国家自然科学基金项目“利用黄鳝性逆转模型探索 piRNA 通路在性别决定中的作用机制”(项目编号: 和安徽省
高校质量工程“医学院校物联网工程专业建设医工融合的实践教学新模式”(项目编号: 2016jyxm
您可能关注的文档
- 国际上气象预报和服务效益评价综述-AmazonS3.PDF
- 国际学术会议英语口语100句.PDF
- 国际公路货物运输合同公约简称CMR.PPT
- 国际民用航空组织世界气象组织在基于全系统信息管理的环境-ICAO.PDF
- 国际物流-浙江海洋学院东海科技学院.PPT
- 国际货运代理政策宣讲-青岛国家税务局.PPT
- 国际货运代理课程标准-永川职教.DOC
- 国际货运代理责任及其责任保险.PPT
- 图书馆情报信息服务调查表.DOC
- 图的Steiner最小树问题的降阶回溯算法-计算机工程与应用.PDF
- 基于数据路由的分布式备份数据去重系统-计算机工程.PDF
- 基于时间序列LAI和ET同化的冬小麦遥感估产方法-IngentaConnect.PDF
- 基于最优化估计的ATM智能化选址模型研究-计算机应用与软件.PDF
- 基于最小代价函数的网格资源发现算法-燕山大学学报.PDF
- 基于服务的移动用户界面软件架构研究倡-计算机应用研究.PDF
- 基于李亚普诺夫稳定性理论的压气机失速主动控制方法-推进技术.PDF
- 基于条件独立性的LiNGAM模型剪枝算法-计算机应用与软件.PDF
- 基于水生态文明视角的都江堰水文化内涵与启示.PDF
- 基于水联网及智慧水利提高水资源效能-水资源研究所.PDF
- 基于欧姆龙CP1HPLC和组态王的射流泵测试系统-电子设计工程.PDF
最近下载
- 贵州国企招聘2025贵州航空产业城集团股份有限公司旗下子公司贵州安立航空材料有限公司招聘61人笔试历年参考题库附带答案详解(10卷合集).docx
- 山西省居住建筑节能设计标准.pdf VIP
- 危化品车辆承包协议书范本.docx VIP
- 中国艾滋病诊疗指南2024版.pptx VIP
- 富士胶片新一代内窥镜系统7000说明书.pdf VIP
- 高中英语人教版必修第一册词汇表单词英译汉默写.pdf VIP
- 2025年商业银行、信用联社中层干部竞聘考试题及答案 .pdf VIP
- 文华财经指标公式源码趋势画线画段.doc VIP
- (正式版)B 3100-1993 国际单位制及其应用.docx VIP
- 西门子工业PC SIMATIC IPC627C入门指南(中文).pdf
文档评论(0)