- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于聚类算法的结构变异及其形成机制识别-计算机应用研究
优先出版 计 算 机 应 用 研 究 第33 卷
基于聚类算法的结构变异及其形成机制识别*
王丽莉,艾冬梅*
(北京科技大学 数理学院,北京,100083)
摘 要:在人类基因组上存在着涉及到不同序列长度的结构变异,这些结构变异对癌症的发生和发展产生了显著的影响。
随着新一代测序技术的发展以及测序成本的降低使得在全基因组水平研究结构变异变得可能。本文基于聚类算法对千人
基因组3 个不同地区的样本以及CGHub 数据库中结直肠癌样本进行了结构变异识别,并基于间断点处的序列同源性对
结构变异的形成机制进行了分析。利用方差分析及非参数检验分析了结构变异和癌症的关系以及结构变异与地域之间的
关系。最后,探讨了该领域未来的发展趋势。
关键词:全基因组测序;聚类算法;基因组结构变异;形成机制
中图分类号:TP301.6
Structural variation and its mechanism detection based on clustering algorithm
Wang Lili, Ai Dongmei*
(School of Mathematics Physics , University of Science Technology Beijing , Beijing 100083, China )
Abstract: There are a number of structural variations of different lengths in the human genome, which has a significant impact
on the occurrence of cancer. With the development of new generation high-throughput sequencing technology and the falling
cost of sequencing make it possible to study structural variation at whole genome level. Samples from three different regions of
The 1000 Genomes and colorectal cancer samples from the CGHub database were analyzed based on the clustering algorithm.
Mechanisms of the structural variation were analyzed according to the sequence homology at the breakpoints . Relationship
between structural variation and cancer, as well as the relationship between structural variation and regional factors were
analyzed by variance analysis and non-parameter tests. At the end of this paper, the future development in this research area is
pointed out.
Key Words: whole genome sequencing; clustering algorithm;genome structural variation; mechanism of structural variatio
文档评论(0)