网站大量收购闲置独家精品文档,联系QQ:2885784924

单细胞数据的伪时间轨迹和调控网络推断研究.pdf

单细胞数据的伪时间轨迹和调控网络推断研究.pdf

  1. 1、本文档共121页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

摘要

近年来快速发展的单细胞测序技术可以在单次实验中同时测量数万个细胞数千

个基因的表达量,产生了大量静态的单细胞快照数据,从而可以揭示出不同细胞间的

微小差异。单细胞的规模性和复杂性使其成为了大数据研究的范例。如何从大规模异

质单细胞数据集提取有效的生物信息,揭示基因之间隐藏的关联、交互和动态特性面

临着重大挑战。对于单细胞数据的分析和处理已经成为了计算生物学的一个热门课题,

有许多问题有待于解决和突破,受到了大量研究人员的关注。

本文主要研究单细胞数据的伪时间轨迹推断以及基于伪时间轨迹的单细胞基因

调控网络构建问题。通过识别单细胞的伪时间轨迹,为理解细胞行为和命运决定提供

了全新的视角,为细胞发育的动力学机制提供了理论解释。通过构建基因调控网络,

有助于从整体上了解不同基因的功能和基因之间的相互作用,更好地理解细胞内部的

基因表达机制,促进疾病病理的研究。

本文的主要研究工作如下:

第一,我们开发了一个新的基于路标点构建单细胞伪时间轨迹的算法SCOUT。该

方法首先通过局部线性嵌入降维算法将数据投影到一个低维空间。然后我们提出一种

新的基于细胞密度寻找路标点的方法,可以比常规的基于聚类中心的方法找到更多的

路标点,这样构建的最小生成树会更加稳健,从而减少了单细胞数据噪声的影响。此

外我们提出基于阿波罗圆投影或者权重距离来计算单细胞伪时间,提高了伪时间轨迹

推断算法的准确性。

第二,我们开发了一个新的基于扩散传播的单细胞伪时间轨迹推断算法DTFLOW。

该方法首先基于每个数据点及其邻近点的欧氏距离构建一个近邻图矩阵,然后利用高

斯核函数将其转换为一个马尔可夫转移矩阵,这时可以通过重启随机游走算法将不同

的数据点转化为同一概率空间的不同离散分布。接着利用巴氏系数可以构建一个巴氏

核矩阵,并通过对数操作将其转换为一个新的核矩阵,基于该核矩阵进行降维和伪时

间排序。我们提出的新方法一方面其降维过程采用了新的技巧,另一方面单细胞的伪

时间排序不完全依赖于降维过程,大大减少了信息损失。我们同时提出一种新的基于

已排序结果在近邻图上逆向搜索识别分支的方法,比较符合单细胞的分化过程。数据

实验表明DTFLOW优于目前先进的伪时间轨迹算法。

第三,我们设计了一个新的基于伪时间轨迹的的单细胞基因调控网络构建模型。

假定通过伪时间轨迹推断算法已经得到了不同单细胞的伪时间排序。该模型通过一个

自顶向下的方法和一个自底向上的方法来研究调控网络,即首先基于单细胞的伪时间

推断基因调控网络的结构,然后构建一个微分方程来描述基因调控网络的动态特征。

该过程考虑了单细胞基因调控的时间依赖性,实验结果表明其用于基因调控网络是一

种非常有效的方法。

综上所述,本文的研究为单细胞的数据分析问题提供了一个新的框架,并在该框

架中实现了新的算法和模型,针对单细胞数据上的信息提取进行了有意义的探索和尝

试,为今后的研究提供了思路。

关键词:单细胞数据分析;伪时序轨迹推断;降维;流形学习;核方法;调控

网络推断

Abstract

Therapiddevelopmentofsingle-cellsequencingtechnologyinrecentyearscan

simultaneouslymeasuretheexpressionofthousandsofgenesintensofthousandsofcells

inasingleexperiment,resultinginalargenumberofstaticsingle-cellsnapshotdata,which

canrevealsmalldifferencesbetweencells.Thevolumeandcomplexityofsingle-celldata

makeitaparadigmofbigdata.Itisamajorchallengesthathowtogeteffectivebiological

informationfromlargeheterogeneoussingle-celldatasetsandrevealhiddenassociations,

interactions

文档评论(0)

论文资源 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档