- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于改进的k最近邻算法的单体型重建问题
Computer Science and Application 计算机科学与应用, 2012, 2, 17-21
/10.12677/csa.2012.21004
Published Online March 2012 (/journal/csa)
An Improved KNN Algorithm for Haplotype Reconstruction
Problem
Tao Zhuang, Hong Liu
School of Computer Science and Technology, Shandong University, Jinan
Email: zhtao663@163.com
Received: Dec. 1st, 2011; revised: Dec. 29th, 2011; accepted: Jan. 14th, 2012
Abstract: Single Nucleotide Polymorphisms (SNPs) is a single base pair position in genomic DNA where different
nucleotide variants exist in some population, and is considered as the most frequent form of human genetic variants.
The haplotype is composed of the SNP which was found to contain more genetic information. Study it plays an important
role in the diagnosis of disease and drugs design. Haplotype reconstruction is to reconstruct a pair of haplotypes from
localized polymorphism data got through short genome fragment assembly. In this paper, a new clustering method,
based on KNN and PSO algorithms, is proposed to solve haplotype reconstruction problem. In the end, it will be used
simulation data and real biological data to test the proposed algorithm, and the results show that the proposed method is
feasible.
Keywords: SNP; Haplotype Assembly; Cluster; KNN; PSO
基于改进的 k最近邻算法的单体型重建问题
庄
涛,刘
宏
山东大学计算机科学与技术学院,济南
Email: zhtao663@163.com
收稿日期:2011年 12月 1日;修回日期:2011年 12月 29日;录用日期:2012年 1月 14日
摘
要:单核苷酸多态性(SNPs)是人类遗传变异中最显著的一种形式,是一个物种中 DNA序列中某个位点上的
碱基变化。人们发现由单核苷酸组成的单体型比单一的单核苷酸包含更多的生物遗传信息,因此研究单体型对
于诊断疾病和药物研制有着重要作用。单体型重建就是对由 SNP片段组成的基因片段进行组装,从而构造出原
来的一对单体型。本文在 k 最近邻和粒子群算法的基础上,提出一种解决单体型重建问题的一种聚类算法。最
后,本文将用模拟数据和真实数据来检验本文所提出的算法,结果证明所提出的算法可行。
关键词:单核苷酸多态性;单体型重建;聚类;k最近邻算法;粒子群算法
1.引言
基因的研究、遗传疾病的诊断和药物研制有着重要作
[1]
用。人类的 DNA 序列是按染色体成对出现的,每一
条染色体上 SNP位点上的碱基序列叫做单体型,所以
人类等二倍体生物都有一对单体型。在医学研究中,
单体型数据通常比单个 SNP携带更多的信息。基于单
体型在遗传分析上的重要性,现在人们较为关注的是
单体型的检测问题。
随着人类基因组图谱的基本完成 ,人们对遗传
的差异性、由基因突变引起的疾病复杂性有了更精确
的阐释 。现在人们普遍认为,DNA序列中少数的差
[2]
异是导致遗传疾病的主要原因。单核苷酸多态性
(SNPs),DNA某一位置碱
您可能关注的文档
最近下载
- 季度查漏补种登记表.doc VIP
- GB50318-2017 城市排水工程规划规范.pdf VIP
- 2025至2030中国移动视频监控行业市场占有率及投资前景评估规划报告.docx VIP
- 汽车门锁及空调故障.pptx VIP
- 生态环境数据分级管理指南.pdf VIP
- 八省联考2026届高三年级12月检测训练(T8联考)化学试卷(含答案详解).pdf
- 2022春(六下)顺 - 填空题1.docx VIP
- T∕CACM 1319-2019 慢性阻塞性肺疾病中医诊疗指南.docx VIP
- GZ021 化工生产技术赛项(正式赛卷)仿真操作模块方案及评分6.doc VIP
- 金蝶云星空完整版.pdf VIP
原创力文档


文档评论(0)