- 1、本文档共80页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基因表达预测模型研究-计算机技术专业论文
学校代码 分 类 号
10701 TP30
学 号 1203121828
密 级 公开
TN82西安电子科技大学
TN82
硕士学位论文
基因表达预测模型研究
工程硕士作者姓名: 孟祥虎
工程硕士
领 域: 计算机技术
学校导师姓名、职称: 刘立芳副教授
学位类别: 李企业导师姓名、职称:杜哲高级
学位类别: 李
提交日期: 2014 年 12 月
Research of Gene expression prediction
model
A thesis submitted to XIDIAN UNIVERSITY
in partial fulfillment of the requirements for the degree of Master
in Computer Technology
By Meng.xianghu
Supervisor: Liu lifang Du zhe November 2014
西安电子科技大学
学位论文独创性(或创新性)声明
秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在 导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标 注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成 果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的 材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说 明并表示了谢意。
学位论文若有不实之处,本人承担一切法律责任。
本人签名: 日 期:
西安电子科技大学
关于论文使用授权的说明
本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属于西安电子科技大学。学校有权 保留送交论文的复印件,允许查阅、借阅论文;学校可以公布论文的全部或部分 内容,允许采用影印、缩印或其它复制手段保存论文。同时本人保证,获得学位 后结合学位论文研究成果撰写的文章,署名单位为西安电子科技大学。
保密的学位论文在 年解密后适用本授权书。
本人签名: 导师签名:
日 期: 日 期:
摘要
摘要
西安电
西安电子科技大学硕士学位论文
I
I
PAGE
PAGE VI
摘要
当人类基因组完成测序,基因表达调控的研究成为了生物信息学的重点。根 据中心法则可知基因表达调控的主要阶段是基因的转录。基因的转录与转录因子、 组蛋白修饰、DNase I 灵敏度等有着紧密的联系。随着分子生物实验的改进,能 够更准确的衡量基因表达的程度,为利用回归模型模拟转录因子、组蛋白修饰、 DNase I 调控基因表达的过程创造了条件。同时,利用回归模型进行基因表达预 测也成为了生物信息学的一个热点问题。
本文主要工作是建立 3 种回归模型预测基因的表达,分别是多元线性回归模 型,支持向量回归模型,回归树模型。我们分别将转录因子、组蛋白修饰和 DNase I 的数据作为回归模型的解释因子预测基因表达,我们得出以下结论:转录因子 联合组蛋白修饰和 DNase I 能够增强回归模型的预测能力,同时基因表达的程度 可以通过计算手段得到,而不仅仅是通过生物实验。
首先我们利用多元线性回归模型预测基因的表达。分析了回归模型的拟合度 和预测能力。实验结果表明回归模型达到了预定的效果,但其对模型中各个因素 处理过于简单。
然后我们利用支持向量回归模型预测基因的表达,比对了支持向量回归模型 和多元线性回归模型预测基因表达的能力,同时比对了拟合度。实验结果表明: 支持向量回归模型不仅仅能提升拟合度,同时也能提升预测能力。为了证明结果 的提升归因于支持向量回归的核函数, 我们分别做了有核函数和无核函数的计算, 计算结果表明了这种假设的成立。我们将组蛋白修饰信息作为先验概率,与转录 因子亲和度分值结合,得到后验对数几率得分,将该值作为回归模型的特征,实 验结果表明模型中加入组蛋白修饰信息可提高基因表达的预测能力。因此我们得 出结论:转录因子、组蛋白修饰和 DNase I 对基因的表达均具有调控作用,这些 信息的有效组合能极大提高模型的预测能力。
最后我们利用回归树模型预测基因的表达,然而,回归树模型在拟合度和预 测能力与其他模型相比较稍微低。于是,我们提出了基于线性变换的回归树模型。 该模型是先联合每个解释因子做线性回归,挑选出合适的解释因子组成新的解释 因子集合,再利用回归树建立回归模型。该改进模型相对最原始的回归树模型和 多元线性回归模型在拟合和预测能力上都得到了提升,但还是略低于支持向量回 归模型。总之,我们用三种回归模型都能收获到很好的实验结果,转录因子、组 蛋白和 DNase I 的计算模型起着先决条件。
关键字: 转录因子,组蛋白修饰,支持
您可能关注的文档
- 基于am335x的rtu设计与实现-计算机技术专业论文.docx
- 基于ajax采砂管理系统设计与实现-水利水电工程专业论文.docx
- 基于android智能抄表机客户端软件开发-模式识别与智能系统专业论文.docx
- 基于android系统的畅跑助理软件的设计与实现-软件工程专业论文.docx
- 互穿网络型涂料印花粘合剂的研制及应用-纺织化学与染整工程专业论文.docx
- 基于arcgis城乡一体化地籍信息管理系统的设计与实现-软件工程专业论文.docx
- 互联网培训软件测试工程师项目商业计划书-工商管理专业论文.docx
- 基于android的移动税务管理系统研究与设计-软件工程专业论文.docx
- 基于arm的dtu遥信与遥控单元的设计与实现-电子与通信工程专业论文.docx
- 基于android平台跌倒检测软件设计-电子与通信工程专业论文.docx
最近下载
- 露天矿采矿与剥离作业规程.pdf VIP
- 电大国家开放大学《政府经济学》(本)2025-2026期末试题及答案2025.pdf VIP
- 第27课 定速巡航的控制 教案 义务教育人教版信息科技六年级全一册.docx VIP
- 幼儿园美术教案《沙漠里的树》植树节主题活动PPT课件.doc VIP
- Java基础知识大全单选题100道及答案.docx VIP
- 工匠精神精品课件.pptx
- 25《带上她的眼睛》课件(共45张PPT).pptx
- 上海海事大学2021-2022年《货币银行学》期末考试试卷(A卷)含参考答案.docx
- 2024年福建省中考化学真题试卷(含答案).docx VIP
- 风电场并网测试方案.docx
文档评论(0)