- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要
摘 要
近年来,越来越多的复杂疾病,如癌症、糖尿病、心脑血管疾病等,正成为死亡率极
高的疾病。而且,生物学家和医学家的研究表明,这些复杂的疾病往往与多种生物分子有
关联,如药物- 靶标相互作用(Drug-Target Interaction ,DTI )、药物- 疾病相互作用
(Drug-Disease Interaction ,DDI )、miRNA-疾病关联(miRNA-Disease Association,MDA )
和lncRNA-疾病关联(lncRNA-Disease Association ,LDA )。虽然这些疾病关联数据中,蕴
含着解决复杂疾病的关键的生物信息规律,但是,这些数据中包含着大量的噪声,这些噪
声会干扰挖掘潜在的疾病关联信息。在生物信息学中,矩阵分解模型是一种被广泛应用的
预测模型,如图正则矩阵分解模型(Graph Regularized Matrix Factorization ,GRMF )和协
同矩阵分解模型(Collaborative Matrix Factorization ,CMF )。但是,传统的矩阵分解模型
在疾病关联预测中存在着一些弊端:疾病关联数据集中的噪声值会干扰算法的准确度;误
差值的平方项会增加算法对于异常值的敏感性从而降低算法的预测精度;传统的方法仅仅
使用单一的疾病语义相似性而忽略了它们之间的网络相似性;传统的方法所使用的数据集
并没有考虑到数据间的内部几何结构。因此,针对存在的这些问题,基于传统的GRMF 和
CMF 方法,分别对其做出了相应的改进,相比于目前存在的一些其他的先进方法,改进后
的方法具有较高的预测精度。针对不同的疾病关联数据,具体主要包括以下四个方面的研
究:
(1)针对药物-靶标相互作用数据集,提出了一种基于稀疏的图正则矩阵分解方法
(L2,1-GRMF )。考虑到预测DTI 既耗时又昂贵,重要的是要提高计算方法的准确性。有许
多算法可以预测全局相互作用,其中一些算法使用药物-靶标网络进行预测。由于数据集通
常位于低维非线性流形上,因此,在GRMF 方法中引入L2,1 范数来产生矩阵的行稀疏,从
而学习这些流形结构。通过在不同的DTI 数据集上实验表明,在大多数情况下,L2,1-GRMF
方法优于其他方法。
(2 )针对 miRNA-疾病关联数据集,提出了一种鲁棒协同矩阵分解方法(RCMF )。
预测潜在的MDA 既耗时又昂贵,所以提高预测结果的准确性迫在眉睫。因此,开发一种
新的计算模型来预测新的 MDA 至关重要。尽管现有的一些方法可以有效地预测潜在的
MDA ,但仍然存在一些不足。特别是在处理疾病矩阵时,其稀疏性是影响最终结果的重要
因素。将L2,1 范数引入到CMF 中以实现算法的稀疏性,从而证明了算法具有鲁棒性,同时
得到了比其他先进方法更高的AUC (Area Under roc Curve )值。
(3 )针对药物-疾病相互作用数据集,提出了一种双网络稀疏协同矩阵分解方法
(DNL2,1-CMF )。开发一种新药极其困难,需要耗费大量的时间和金钱。目前常用的手段
是根据已知的DDI ,去预测未知的DDI 。因此,一个有效的数据挖掘方法变得非常关键。
通过使用高斯互作谱(Gaussian Interaction Profile ,GIP )核函数计算出药物的网络相似性
I
摘要
和疾病的网络相似性,然后分别将lncRNA 网络相似性矩阵与lncRNA 表达相似性矩阵组
合,疾病网络相似性矩阵与疾病表达相似性矩阵组合。最后,为了增加疾病矩阵的稀疏度,
在疾病子矩阵上引入了L2,1 范数约束。实验结果表明,所提方法具有较好的预测性能并能
够有效地预测出潜在的DTI 。
(4 )针对 lncRNA-疾病关联数据集,提出了一种加权图正则协同矩阵分解方法
(WGRCMF )。随着生物学和医学的发展,越来越多的研究表明lncRNA 与疾病有关,因
此寻找一些新的LDA 尤为重要。更重要的是,一些潜在的LDA 对疾病的治疗和预防是有
益的。图正则化约束项引入到 CMF 中,考虑到流形学习可以从高
原创力文档


文档评论(0)