- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章核酸序列分析和结构预测
DNA碱基组成、
密码子的偏向、
内部重复序列、
指定DNA序列 特殊位点(限制性位点
的分析 及转录、翻译和表达调
控相关信号)、
编码区分析、
二级结构等
面向测序的DNA
序列分析
一、序列格式转化
各种软件为了自己的需要,通常对序列格式
有一定的要求,给我们的使用带来了一定的困
难。格式转换软件可以将不同格式数据转换以方
便使用。很多综合性软件可以进行序列格式转
换,如: Bioedit,DNAstar ,seqverter等。
常见序列格式
(1 )FASTA格式: 又称Pearson格式。是比较
简单而使用最多的序列格式。序列以号开
头,其后是单行的关于序列的描述信息,最后
是序列。例子:
10KD_VIGUN P18646 vigna unguiculata 10
kda protein precursor
MEKKSIAGLCFLFLVLFVAQEVVVQSEAK
TCENLVDTYRGPCFTTGSCDDHCKNKEH
LLS
常见序列格式
(2 ) plain text格式 是一个形式最简单的格式,
没有任何的注释,每行60个字母,使用标准核
甘酸符号或标准的氨基酸的单字母符号。例
如:
MEKKSIAGLCFLFLVLFVAQEVVVQSEAKT
CENLVDTYRGPCFTTGSCDDHCKNKEHLL
S
常见序列格式
(3 )GCG格式 是商业性的GCG软件包的专用
格式,例如:
1 ggagactttc ctgtcactgg ctactactac tcccaaccct cctcaaagcc gccggagcaa
61 cccccaggtc tttactttac aatcggcaat ttgacttgct ctgctgcatg tctggaggga
121 ccaaggaaag tgtggagacg ctccaaggat taggtgatcg gagcttgaaa agaaaaaaag
常见序列格式
(4 )Genbank格式 例如:
LOCUS AB094638_1 146 bp DNA 13-APR-2006
BASE COUNT 38 a 17 c 43 g 48 t 0 others
ORIGIN
1 gttttaatgt gttgccttgg ttgagtggtg aagctggtta gggtagcgtg taaaacatgg
61 tgggtagatt aatgctttgt gtcaccatgc cgtttggttc gattaatgta atcataagga
121 gagaccataa gttatgaata cgcaga
Seqverter
最新下载
/download.htm
*下载后直接安装即可
Working online
BCM Search Launcher: Sequence Utilities
/seq-util/seq-
util.html
二、核酸序列的基本分析
1 分子质量、碱基组成和碱基分布
1.1 碱基组成
DNA序列一个显而易见的特征是四种碱基
类型的分布。尽管四种碱基的频率相等时对
数学模型的建立可能是方便的,但几乎所有
文档评论(0)