- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验三DNA序列分析.
实验三 DNA序列分析
实验目的
熟悉核酸数据库搜索。
掌握序列分析的基本操作。
熟悉序列分析的生物信息学函数。
所需软件
MATLAB 7.0或MATLAB 7.0以上的版本
实验内容
生物信息工具箱可以进入许多网络数据库,它支持许多普通的基因组文件格式,用户可以直接复制序列和基因表达信息到MATLAB中。目前主要的序列数据库有国际基因库Genbank,蛋白质序列库GenPept,欧洲分子生物数据库EMBL,蛋白质数据库PSD。用户也可以从同源蛋白家族数据库PFAM中得到多重比对序列,隐藏Markov模型图谱,系统发生数据。此外,MATLAB还可以从基因测序仪、质谱仪和Agilent微阵列扫描仪上读取数据。
利用生物信息工具箱,用户可以选择一系列的分析方法来执行成对或多重序列比对,确定序列的一系列统计量,在一个序列中查找特定序列,或是查找开放阅读框。此外,还可以创建随机序列,从一组多序列比对的氨基酸、核苷酸序列中找出共同序列,对序列格式化或用频率数据图解显示一个序列比对结果。
用户可以使用一系列的蛋白质分析方法从数据中选取信息。工具箱提供了用于计算蛋白质序列性质的多个函数,比如基本组成,分子量和等电点等。用户可以预测氨基酸序列的统计量并获得有关特征的编码信息;计算两生物序列间的距离和计算替换率;并利用距离数据构建系统发生树;在交互性的图形用户界面里观察系统发生树和编辑数据;也可以在这个图形用户界面里观察系统发生树和编辑数据;也可以在这个图形用户界面中修剪分支、重排、改名和测量距离。
总之,MATLAB可以执行成对序列或多重序列的比对,进行序列转换,绘制序列图谱,进行微阵列数据分析等。用户还可以创建自己的算法和应用程序,并与其他用户分享。
序列分析
序列分析是利用计算机方法来寻找有关核苷酸或氨基酸序列的信息。序列分析的一般工作是基因识别,确定两个基因的相似性,确定一个基因的蛋白质编码以及研究另一有机体中相似基因的功能。在分析完一段DNA序列之后,首要任务就是研究序列中的核苷酸含量。本实验使用序列统计函数来确定核苷酸含量,并找出开放阅读框。如无特别说明,均以人类线粒体基因组为例,逐个介绍序列分析的相关函数。
核酸数据库搜索(搜索人类线粒体基因组)
进入NCBI(/ )→搜索列表【search】中选择【Genome】,目的栏【for】中输入人类线粒体【mitochondrion homo sapiens】。
2)点击链接标签NC_001807,获取人类线粒体基因组信息页面。下载NC_001807的全基因组序列保存为NC_001807.txt的genbank格式和NC_001807fasta.txt的fasta格式。
2. 获取序列信息
在命令窗口中,使用fastaread函数构建fasta格式的结构体,并利用getfield函数读取序列信息,
Mitochondria=fastaread(NC_001807fasta.txt)
mitochondria= getfield(Mitochondria, Sequence)
确定核苷酸的组成
一个含A+T丰富的核苷酸DNA片段通常是序列的一部分,而含A+T低,含G+C丰富的核苷酸则是潜在的基因。通常,一个基因的CG二核苷酸含量都是已经确定的。在读取到一段序列到MATLAB中以后,用户可以使用序列统计函数确定这个序列是否含有蛋白质编码区的特征。
绘制密度图 使用ntdensity函数绘制单体密度和联合体密度图。
ntdensity(mitochondria)
计算核苷酸数目 使用basecount计算核苷酸数目
basecount(mitochondria)
计算互补核苷酸数目 使用seqrcomplement函数计算互补核苷酸数目
basecount(seqrcomplement (mitochondria))
显示核苷酸分布 使用basecount显示核苷酸分布的饼状图
basecount(mitochondria,’chart’,’pie’);
计算二聚体个数 使用dimercount函数计算一个序列中的二聚体个数,并在一个图形中显示出来。
dimercount (mitochondria,’chart’,’bar’);
确定密码子组成
计算密码子数目 使用codoncount函数计算一个核苷酸序列中的密码子数目
codoncount(mitochondria)
绘制热红外分布图
for frame = 1:3
figure
subplot(2,1,1); codoncount(mitochondria,frame,frame,figure,true)
文档评论(0)