- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数数 学学 建建 模模 培培 训训
多多元元统统计计分分析析
11..问问题题引引入入
22..思思路路点点拨拨
目 录录
33..判判别别分分析析方方法法
44..DDNNAA序序列列分分类类问问题题的的求求解解
55.. 参参 文文献献
11..问问题题引引入入
首首先先,,我我们们来来考考虑虑一一下年 ““网网易易杯杯””
全全国国大大学学生生数数学学建建模模竞竞赛赛的的AA题题 关关于于 ““DDNNAA
序序列列分分类类””的的问问题题
人人类类基基因因组组中中的的DDNNAA全全序序列列是是由由44个个碱碱
基基AA,,TT,,CC,,GG按按一一定定顺顺序序排排成成的的长长约约33 亿亿
的的序序列列,,毫毫无无疑疑问问,,这这是是一一本本记记录录着着人人类类
自自身身生生老老病病死死及及遗遗传传进进化化的的全全部部信信息息的的
““天天书书””。。但但是是,,除除了了这这四四种种碱碱基基外外,,人人
们们对对它它所所包包含含的的内内容容知知之之甚甚少少,,如如何何破破译译
这这部部 ““天天书书””是是二二十十一一世世纪纪最最重重要要的的任任务务
之之一一。。在在这这个个目目标标中中,,研研究究DDNNAA全全序序列列具具有有
什什么么结结构构,,由由这这44个个字字符符排排成成的的看看似似随随机机的的
序序列列中中隐隐藏藏着着什什么么规规律律,,又又是是解解读读这这部部天天
书书的的基基础础,,是是生生物物信信息息学学 ((BBiiooiinnffoorrmmaattiiccss))
最最重重要要的的课课题题之之一一。。
虽虽然然人人类类对对这这部部 ““天天书书””知知之之甚甚少少,,但但也也
发发现现了了DDNNAA序序列列中中的的一一些些规规 性性和和结结构构。。例例
如如,,在在全全序序列列中中有有一一些些是是用用于于编编码码蛋蛋白白质质
的的序序列列片片段段,,即即由由这这44个个字字符符组组成成的的6644种种不不
同同的的33字字符符串串,,其其中中大大多多数数用用于于编编码码构构成成蛋蛋
白白质质的的2200种种氨氨基基酸酸。。又又例例如如,,在在不不用用于于编编
码码蛋蛋白白质质的的序序列列片片段段中中,,AA和和TT的的含含量量特特别别
多多些些,,于于是是以以某某些些碱碱基基特特别别丰丰富富作作为为特特征征
去去研研究究DDNNAA序序列列的的结结构构也也取取得得了了一一些些结结果果。。
此此外外,,利利用用统统计计的的方方法法还还发发现现序序列列的的某某些些
片片段段之之间间具具有有相相关关性性,,等等等等。。这这些些发发现现让让
人人们们相相信信,,DDNNAA序序列列中中存存在在着着局局部部的的和和全全局局
性性的的结结构构,,充充分分发发掘掘序序列列的的结结构构对对理理解解DDNNAA
全全序序列列是是十十分分有有意意义义的的。。
作作为为研研究究DDNNAA序序列列的的结结构构的的尝尝试试,,试试对对以以下下序序列列进进
行行分分类类::
问问题题一一::下下面面有有2200个个 知知类类别别的的人人工工制制造造的的序序列列
((见见附附件件11)),,其其中中序序列列标标号号11——1100为为AA类类,,1111--2200
为为BB类类。。请请从从中中提提取取特特征征,,构构造造分分类类方方法法,,并并用用这这
些些 知知类类别别的的序序列列,,衡衡量量你你的的方方法法是是否否足足够够好好。。
然然后后用用你你认认为为满满意意的的方方法法,,对对另另外外2200个个未未标标明明类类
别别的的人人工工序序列列 ((标标号号2211——4400))进进行行分分类类,,把把结结果果用用
序序号号 ((按按从从小小到到大大的的顺顺序序))标标明明它它们们的的类类别别 ((无无
法法分分类类的的不不写写入入))::
AA类类
文档评论(0)