- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于网络的流感病毒复制的研究
摘 要:流感病毒是一种重要的呼吸道疾病病原,容易在人群中造成地方流行,给人类带来灾难和危害。利用A型流感病毒的四种毒株H3N2、H5N1、H7N7和H7N9的基因表达谱数据集,运用偏最小二乘法,分别构建了四个流感病毒感染复制的调控网络,挖掘了四个数据集下在病毒复制过程中发挥重要功能的基因,为进一步探索流感病毒在宿主细胞内的复制机制,揭示流感病毒的致病机理提供了可能。
关键词:偏最小二乘法 病毒复制 复杂网络
中图分类号:TP393 文献标识码:A 文章编号:1672-3791(2017)01(a)-0000-00
基金?目:湖北省教育厅科学技术研究计划青年人才项目(;武汉工程大学第十期大学生校长基金项目(2015008)
1 引言
人类约60-70%的传染性疾病是由病毒感染所引起。近年来,重大病毒传染性疾病的爆发流行日趋严重,对人类健康和社会经济发展构成了巨大威胁。而这些病毒必须依靠宿主细胞才能不断的复制下去,基于网络的系统生物学方法,揭示病毒复制及与宿主相互作用网络的分子机制,发现抗病毒药物新靶标,为病毒性传染病预防和治疗提供新理论和新技术,是当前生命科学研究的前沿领域之一[1]。
2 多层网络的构造
2.1数据来源
在美国国家生物信息中心已经公开的数据库中,GEO号为GSE49840的数据库中包含了四组基因表达谱数据。这四组数据分别是被新型禽源流感病毒H7N9,禽流感病毒H5N1和H7N7,以及H3N2流感病毒数据。该实验数据通过四种不同的病毒去感染样本,并且分别测量了病毒感染后宿主在3小时、7小时、12小时和24小时的基因表达谱数据。
2.2 数据预处理
对于每一组基因表达谱数据,我们根据探针信息的注释文件,将探针号与基因ID号对应起来,如果没有对应的基因ID号,我们将舍弃该探针,如果有几个探针对应的是同一个基因的ID号,我们将这几个探针的平均值作为该基因的表达谱数据。
2.3 基因的选取
自2008年以来共有六个科研小组发现了参与流感病毒复制的人体宿主细胞因子,在这些宿主因子中有128个宿主基因至少被两个实验证明参与了流感病毒复制[2]。我们发现这128个基因中有116个基因在GSE49840数据库中有基因表达谱数据值,所以我们以这116个基因作为我们研究工作的候选基因。
2.4 多层网络的构建
一共有四组基因表达谱数据,所以我们构建了一个四层的多层网络,每一层是一种流感病毒的复制调控网络,用一个线性方程来近似基因间的调控关系,用偏最小二乘法求解线性模型中的调控参数,并进一步利用阈值筛选有显著意义的调控关系,具体的步骤如下:
(1)计算成对基因之间的皮尔逊相关系数,设定阈值,得到一个流感病毒复制调控的初始网络;
(2)为了简化,用一个线性方程来描述病毒复制有关的基因之间的调控关系:
其中 表示第 个基因的表达水平, 表示第 个基因对第 个基因的作用强度。
(3)在Matlab中调用spline函数,根据基因在3小时、7小时、12小时、24小时的表达值,利用三次样条插值每隔0.5小时进行插值,然后用中心差分值代替微分值,得到基因在3小时、7小时、12小时、24小时这四个时刻的表达值变化率:
(f)选取合适的阈值 ,删除相互作用强度较小的边,从而得到每种病毒感染下的基因调控网络。阈值 的选取是基于统计网络的节点数随着 的变化情况,当节点数发生显著变化时此时对应的 值即为阈值。
3 重要模块及基因的识别
首先基于所构造的多层网络,利用模块探测算法ClusterOne[4],识别了每一层网络中的模块。然后参照文献[5]中定义的模块影响力指标,分别计算了四层网络中每一层网络的高影响力模块,如表1所示:
在这些高影响力模块中,基因DAP3、C6orf62、ACVR1C、ATP6V0D1至少两次出现在了不同病毒的高影响力模块中,我们认为这四个基因在流感病毒的复制过程中发挥了重要的作用。它们可以成为新的抗病毒药物的靶标。
4 结论
本文中基因表达谱数据出发,利用偏最小二乘法构建了一个流感病毒复制的基因调控多层网络,每一层网络是一种流感病毒,然后基于所构造的多层网络挖掘了与病毒复制有关的重要模块和基因为流感病毒复制机制的研究和抗病毒药物的研制提供了新的思路。
参考文献
[1] N.-Y. Hsu, O. Ilnytska, G. Belov, et al. Viral reorganization of the secretory pathway generates distinct organelles for rna rep
文档评论(0)