基于统计的基因识别问题及其算法研究-应用数学专业论文.docxVIP

下载本文档

5
0
约4.12万字
约 60页
2019-03-30 发布于上海
举报
版权申诉

基于统计的基因识别问题及其算法研究-应用数学专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

西安建筑科技大学硕士学位论文西安建筑科技大学硕士学位论文万方数据万方数据基于统计的基因识别问题及其算法研究专业：应用数学硕士生：王璐指导教师：赵彦晖教授摘要基因识别的主要手段是基于活的细胞或生物的实验。通过对若干种不同基因的同源重组的速率的统计分析，我们能够获知它们在染色体上的顺序。若进行大量类似的分析，我们可以确定各个基因的大致位置。然而，由于人类已经获得了巨大数量的基因组信息，依靠较慢的实验分析已不能满足基因识别的需要。随着计算机技术的发展，利用计算机算法识别基因逐渐成为基因识别的主要手段。在面对大量复杂的基因序列数据时，怎样更好更快捷地获取准确的基因遗传信息，怎样在大量的基因序列数据中成功计算功率谱和信噪比，如何快速实现基因识别，具有重要的现实意义和应用价值。本文将通过多元统计分析的相关方法研究基因特征提取和基因识别，建立基因特征提取、基因识别的数学模型，并通过计算机手段进行实现。本文首先通过信号处理方法，采用 Voss 映射、Z-curve 映射，把抽象的符号序列映射成数值序列，并绘制出频谱图，建立了功率谱和信噪比的快速计算方法；通过推导，得到了“Z-curve 映射和 Voss 映射所获得的基因数据的功率谱和信噪比之间”均有倍数关系的结论，且其功率谱 P的比例系数是 4 ，信噪比 R之间的比例系数是 4 ；本文还建立了频谱和信噪比基因识别模型，并将其应用于基因突变数 3 据研究，获得了相应的结论。关键词：基因识别；聚类分析；功率谱；信噪比 The Research of Gene Identification Questions Based on Mathematical Statistics Specialty: Applied Mathematics Name: Wang Lu Instructor: Prof. Zhao Yan-Hui ABSTRACT The principal means of gene identification is experiments which based on the living cells or organism. We can obtain the gene sequence in chromosome by a number of different genes of homologous recombination rate of statistical analysis. If a large number of similar analyses can be made, we can determine the approximate location of every gene. However, a huge quantity of genomic information has been acquired by human; the method which relayed on the slower experimental analysis cannot meet the needs of the gene identification. With the development of computer technology, adopt the computer algorithms to identify genes has gradually become the primary means. When facing the large number of complex gene sequence data; how to better and more quickly get the accurate genetic information, how to calculate the power spectrum and the signal to noise ratio successfully in a lot of gene sequence data; how to quickly achieve the gene identification, all above are important subject before us which have a research significance. The paper makes the extraction for gene feature and identification, builds the model of gene feature extraction and identification,