- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基因调控网络的重构及病毒感染的致病机制
摘要
一个基因的表达受其他基因的影响,而这个基因又影响其他基因的表达,这种相互影响相互制约的关系构成了复杂的基因调控网络。几乎所有的细胞活动和功能都受基因网络调控。本文通过对基因调控网络的重构来推测出病毒感染的致病机制。
由于所给的基因表达谱数据海量,所以首先对基于时间序列给出的272组基因表达谱数据进行降维处理。为了减小噪声以及缺失值度对实验精度的干扰,在实验前剔除四组噪声较大或有缺失的数据。对数据进行降维具体采用聚类分析法:首先将8个健康志愿者的基因表达谱数据导入SPSS中,对数据进行K-means聚类,将11966个基因聚为20类,分别找出与各聚类中心距离最小的基因将其作为特征基因。找出20个特征基因为(6002_at,5042_at,23378_at,54440_at,667_at,6192_at,84663_at,10098_at,2671_at,3117_at,157680_at,1372_at,83440_at,54915_at,25880_at,8846_at,10321_at,7503_at,8678_at,9582_at)。
对于问题一运用线性组合模型。对于经聚类分析处理所得的20个特征基因,分别写出它与其他特征基因以及包括其本身的线性回归模型。基于特征基因的基因表达谱数据利用MATLAB求出其相关系数矩阵,进而判断各基因之间的调控关系。通过此调控关系,运用MATLAB程序构建出基因调控网络。线性组合模型基于时间序列基因表达数据,能够更准确的描述基因调控网络的动态性。
对于问题二,将9个感染病毒志愿者与另8个健康志愿者在相应时刻的总体平均基因表达数据进行比较,并根据9个志愿者出现症状的时刻不同,将其分为5组,同样将健康志愿者也分为5组,通过定义模型来取出影响较大的基因,然后对照基因表对基因作用的描述去寻求该重要蛋白。
关键词: 基因调控网络重构 K-means聚类 特征基因 线性组合模型
问题重述
通过基因之间的相互调控,生物体可以实现细胞的生长,器官的发育、以及免疫等各种生物机能。随着测序技术的发展,产生了越来越多的高通量实验数据。
基于这些实验数据重建基因调控网络(Gene regulatory networks, GRNs),对于深入了解生物机能的实现过程具有重要作用。
生物实验中,在17 个健康志愿者鼻内接种流感病毒H3N2/Wisconsin,其中9 个人出现了严重的感染症状,另外的8个人没有出现症状。接种后,每隔大约8 h从血液中采集样本测量基因表达谱数据,实验数据一共有16 个时间点( 单位: h) ,包括baseline ( -24) ,0,5,12,21,29,36,45,53,60,69,77,84,93,101,108,共268 个样本。基因表达谱数据见附件1,其中前8个为未出现严重感染症状的数据,后9个为出现严重感染症状的数据。(其中行代表探针号,对应着不同的基因;列为各个个体血液样本在各个时间节点的数据)个体出现感染症状的时间节点示意图见附件2。
问题:
1)根据实验数据重构基因调控网络;
2)通过比较出现感染症状的志愿者和健康志愿者的样本数据,试确定病毒感染人体后导致志愿者是否会出现严重临床症状的重要蛋白。
二、问题分析
一个基因的表达受其他基因的影响,而这个基因又影响其他基因的表达,这种相互影响相互制约的关系构成了复杂的基因调控网络。几乎所有的细胞活动和功能都受基因网络调控。本文需要根据基因表达谱数据重构基因调控网络以及对导致出现严重临床症状的蛋白质进行研究。
对于问题一,首先对数据进行聚类分析得到20个特征基因,然后建立线性组合模型,基于基因表达谱数据利用MATLAB求出其相关系数矩阵,进而判断各基因之间的调控关系,通过此调控关系,运用MATLAB程序构建出基因调控网络。
对于问题二,由题目中所给的信息知9个健康志愿者在接种病毒后出现了相应的临床症状,所以其体内部分蛋白肯定发生了变化。可以将出现症状后的数据与前8个没有出现症状的相比较,如果其中某些基因表达谱的数据与正常基因表达数据有较大的波动,则认为其感染病毒后体内出现了重要蛋白。
模型假设与约定
假设不考虑个体之间的差异
假设所给的数据都准确无误
3.假设各基因之间的调控关系是为线性的
4.假设得出的系数矩阵为正数是存在促进关系,为负数时存在抑制关系,零则表示基因之间没有调控作用
5.假设误差项是服从期望为0,方差为的正态分布函数
四、符号说明及名词定义
基因i在t时刻的表示值
2. 出现症状的志愿者的组号
3.
您可能关注的文档
- 急救护理学第1次作业精讲.doc
- 急救护理学精讲.doc
- 肌肉起止点精讲.doc
- 急救流程图10精讲.doc
- 鸡病防治防疫手册(2010版)精讲.doc
- 急救医学精讲.doc
- 鸡常见疾病精讲.doc
- 急救知识与技术精讲.doc
- 急危重症1精讲.doc
- 鸡蛋的营养价值和正确吃法每日一练(5月9日)精讲.doc
- Unit 6 Get Close to Nauture Lesson 22 -课件-2025-2026学年度北京版英语四年级上册.pptx
- Unit 7 Be Together Lesson 23 -课件-2025-2026学年度北京版英语四年级上册.pptx
- 2025食品饮料行业AI转型白皮书-2025食品饮料行业数智化转型领先实践.pdf
- Unit 7 Be Together Lesson 24 -课件-2025-2026学年度北京版英语四年级上册.pptx
- Unit 7 Be Together Lesson 25 -课件-2025-2026学年度北京版英语四年级上册.pptx
- Unit 7 Be Together Lesson 26 -课件-2025-2026学年度北京版英语四年级上册.pptx
- 2025年广州体育职业技术学院单招职业倾向性考试题库完美版.docx
- 软件公司员工考勤异常处理.doc
- 2025年土地登记代理人之土地登记相关法律知识题库500道及完整答案【有一套】.docx
- 2025年四平职业大学单招职业适应性考试题库含答案.docx
文档评论(0)