- 18
- 0
- 约5.63万字
- 约 44页
- 2015-10-21 发布于贵州
- 举报
dna序列类模型
摘要
摘要
依据生物学知识,按照氨基酸分子中侧链基的极性性质,把碱基三联体分成五大类,
即四大类氨基酸和终止码。以五类密码子出现的频率构成的特征向量来表征DNA序列。
这是从不同序列中氨基酸含量不同提炼出能从碱基含量和碱基排列情况两方面代表序列
特征的氨基酸类别信息的方法。 ’
然后用三种统计方法进行分类。用马氏距离判别法和FISHER判别法对给定序列进
行分类,样本回代正确率均达100%,二者分类一致率为90%;应用聚类分析方法对DNA
序列片段进行分类,样本回代正确率达95%。
本模型考虑结合生物学知识,特征向量维度较低,便于计算,分类结果精度较高,
优于仅基于碱基含量的判别分类模型。
关键词:DNA序列;密码子;频率;判别分析;聚类分析
Abstract
tonatureof oftheforkedchainofamino
Abstract:Accordingpolarity acids,it
dividesthebase intofive is four
kindsofaminoacidsand
triplets categories,that stop
the 5kindsof for
extractCharacteristicVector
signal.Byappearancefrequency codon,we
DNA onthedifferentcontentof amino
representingsequence.Base differentacids,the
CharacteristicVectordisclosestheinformationofaminoacidsfromtwo ofContent
aspects
and ofnucleotidebases.
arrangement
DNA isclassifiedStatistical
sequencefragment by theory.DNA
techniques sequence
isclassified classificationof distance
Mahalanobisand
fragment bydiscriminating theory
Fisherdiscriminantmethod.Theresultsshowedthatthe rateofverified Was
positive sample
100%andtheconsistentrateWas90%.DNA isclassifiedCluster
sequencefragment by theory
and
the rateofverified was95%.
positive s
您可能关注的文档
- 若干解析函族的系数估计及其卷积性质.pdf
- 若干非线性子的性质及应用.pdf
- 若干边覆盖策的均衡性研究.pdf
- 若干非线性子的不动点定理.pdf
- 若干逻辑代系统结构的研究.pdf
- 范畴natn)及其半伴随上的自然变换.pdf
- 若干非线性题的研究.pdf
- 落叶松食芽种群动态规律数学模型的研究.pdf
- 薛定谔方程配系统的能控性.pdf
- 薄板弯曲问的集中质量非协调有限元模拟.pdf
- 小区绿化施工协议书.docx
- 墙面施工协议书.docx
- 1 古诗二首(课件)--2025-2026学年统编版语文二年级下册.pptx
- (2026春新版)部编版八年级道德与法治下册《3.1《公民基本权利》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《4.3《依法履行义务》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.2《按劳分配为主体、多种分配方式并存》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.1《公有制为主体、多种所有制经济共同发展》PPT课件.pptx
- 初三教学管理交流发言稿.docx
- 小学生课外阅读总结.docx
- 餐饮门店夜经济运营的社会责任报告(夜间贡献)撰写流程试题库及答案.doc
原创力文档

文档评论(0)