差异甲基化区域识别算法研究-计算机应用技术专业论文.docxVIP

差异甲基化区域识别算法研究-计算机应用技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
差异甲基化区域识别算法研究-计算机应用技术专业论文

万方数据 万方数据 Dissertation Submitted to Hangzhou Dianzi University for the Degree of Master The Research of Identifying Differentially Methylated Region Candidate: Li Huabing Supervisor: A.P. Yang Kun March,2015 杭州电子科技大学 学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明: 所呈交的学位论文,是本人在导师的指导下,独立进行研究 工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或 集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体, 均已在文中以明确方式标明。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 论文作者签名: 日期: 年 月 日 学位论文使用授权说明 本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕 业离校后,发表论文或使用论文工作成果时署名单位仍然为杭州电子科技大学。 学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全 部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。(保密论文 在解密后遵守此规定) 论文作者签名: 日期: 年 月 日 指导教师签名: 日期: 年 月 日 杭州 杭州电子科技大学硕士学位论文 摘 要 DNA 甲基化是一种重要的表观遗传修饰,在胚胎发育、染色体结构、X 染 色体失活、基因组印迹和染色体稳定性、细胞衰老以及疾病的发生和肿瘤的形成 方面发挥着重要的调控作用。不同条件下的生物学样本之间存在的差异甲基区 域,可能参与到基因表达的调控,进而影响基因功能。差异甲基化区域识别与通 常意义上的特征选择有显著区别:通常的特征选择往往假定特征间无关联性,而 CpG 位点即特征在基因组空间中具有位置关联性。已有的研究表明,相对于单 个位点独立的识别方法,针对整个区域的识别方法更有生物学上的价值。然而, 现有差异甲基化区域识别方法存在一些问题,例如过度删除显著性弱的甲基化位 点、区域长度受限以及不能直接处理多类别情况。针对这些问题,本文提出了三 个差异甲基化区域识别算法,主要研究成果如下: 第一,为了能直接处理多类别问题,本文提出了一种利用滑动窗口和 KNN 算法的差异甲基化区域识别算法。算法先通过滑动窗口和 KNN 分类器筛选基因 组上存在的候选差异甲基化区域,然后合并满足分类误差率条件的候选区域得到 差异甲基化区域。真实数据上的实验表明,算法的分类性能、聚类指数明显优于 对照算法,扩展了对照算法识别的区域长度,并能识别对照方法未发现的差异甲 基化区域。 第二,针对本文提出的第一种方法存在两个候选差异甲基化区域在不满足拼 接条件时将会丢失与候选区域相邻的位点这一问题,本文提出了一种基于贪心策 略的差异甲基化区域识别算法。该方法是先利用滑动窗口和 KNN 分类器构建筛 选候选区域模型,再采用贪心策略扩展候选区域长度得到差异甲基化区域。通过 实验分析对比了算法的有效性和准确度,得出该方法表现更优,准确有效。 第三,针对已发表和本文提出的前两个算法存在的一些问题,例如依赖分类 器和需要预先设定实验参数,本文提出了一种基于聚类验证技术的启发式差异甲 基化区域识别算法。该方法是运用聚类验证技术构建差异甲基化区域识别模型, 然后利用贪心思想的启发式算法来优化从基因组上搜索差异甲基化位点子集,使 得不同类别在该子集的维度空间中具有良好的可分性这一问题,从而通过求解差 异甲基化位点子集得到差异甲基化区域。实验结果表明,该方法表现最优,且方 法无参数,简单易用。 关键词:DNA 甲基化,差异甲基化区域,滑动窗口,贪心策略,聚类验证 I ABSTRACT DNA methylation, as an import epigenetic modification, plays an crucial role in embryonic development, chromosome structure,X-chromosome inactivation, genomic imprinting and chromosome stability,cell differentiation, disease and cancer formation and other diseases. The differences between different biological samples under the condition of methyl a

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档