网站大量收购独家精品文档,联系QQ:2885784924

基于深度自编码器的阿尔兹海A-seq数据分析方法研究.pdf

基于深度自编码器的阿尔兹海A-seq数据分析方法研究.pdf

  1. 1、本文档共77页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

基于深度自编码器的阿尔兹海默症scRNA-seq数据分析方法研究

摘要

近年来,越来越多研究者将单细胞RNA测序(scRNA-seq)技术应用在阿尔兹海默症

(AlzheimersDisease,AD)的研究中,但是测序数据的高维、高噪声、高稀疏特点以及

dropout事件导致的缺失为数据的分析利用增加了重重阻碍。考虑到深度神经网络在文

本和图像数据分析上展示的强大性能,基于深度神经网络的scRNA-seq数据分析算法如

雨后春笋般不断涌现。但这些方法无法在关注数据分布特征和拓扑结构信息之间找到平

衡,往往顾此失彼,并且多采用无监督学习,缺乏先验生物知识的指导,产生的聚类簇

与真实情况相差甚大。同时现有方法也难以找到最相似节点集来补全缺失值。本文针对

这些问题,利用自编码器结合其他模型构建深度自编码器,构建一套性能优越的单细胞

RNA测序数据分析算法对阿尔兹海默症病理研究提供帮助。主要工作如下:

从分析现有方法的优缺点入手,提出基于新型胶囊网络与ZINB自编码器协同的

scRNA-seq聚类算法scCapsZB。首先,其使用胶囊网络替代图自编码器,使用非迭代、

训练参数少的自注意力路由取代原始动态路由,以更少的时间和内存消耗来学习细胞结

构关系,提高聚类的生物学可解释性。随后通过ZINB自编码器学习稀疏零膨胀的

scRNA-seq数据特征表示。最后两大模型各层交互并配置监督协同模块统一训练,完成

聚类任务。通过对来自不同生物不同组织的标准数据集进行客观和主观对比评估,证明

了方法在聚类精度和效果上优于目前主流方法。

鉴于单纯的预处理无法应对大规模阿尔兹海默症测序数据集中缺失值多,“真零”

“假零”混杂的情况,提出一种基于对比学习的图自编码器scRNA-seq缺失值插补算法

scICLGAE。其使用两个图自编码器分别处理,引入正负样本的概念,产生不同的特征表

示,再综合全局信息和局部结构选择与目标节点最相似的节点集,平均相似节点表达值

对缺失数据进行补全。可以结合ZINB自编码器捕捉数据特征,帮助聚类。通过插补指

标的对比,证明了算法优于最新的方法。

通过联合使用scICLGAE和scCapsZB完成对阿尔兹海默症scRNA-seq数据的缺失

值插补和聚类分析,展示发病前后细胞簇变化和细胞比例变化,发现了包括阿尔兹海默

症在内的神经系统疾病的基因通路。

关键词:scRNA-seq数据分析;阿尔兹海默症;自编码器;新型胶囊网络;对比学习

基于深度自编码器的阿尔兹海默症scRNA-seq数据分析方法研究

Abstract

Inrecentyears,moreandmoreresearchershaveappliedsingle-cellRNAsequencing

(scRNA-seq)technologytothestudyofAlzheimersdisease(AD).However,thehigh

dimensionality,noise,sparsityandthemissingvalueresultingfromdropouteventsaddmany

obstaclestotheanalysisandutilizationofdata.Consideringtheimpressiveperformanceof

deepneuralnetworksinanalyzingtextualandimagedata,scRNA-seqdataanalysisalgorithms

basedondeepneuralnetworkshaveemergedrapidly.Nevertheless,thesemethodsoften

struggletostrikeabalancebetweendatadistributioncharacteristicsandtopologicalstructure

i

文档评论(0)

n1u。 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档