- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2015-3Blast搜索与序列比对详解
2017-4-3
1
第三章序列比对与Blast搜索
滕虎
《生物统计学与生物信息学》
大连理工大学生命科学与技术学院
2017-4-3
2
教学内容
序列分析
生物信息数据库介绍
二重序列比对与Blast应用
多重序列比对与ClustalX应用
蛋白质序列分析
电子克隆
基因预测
分子进化分析
大分子结构分析
大分子结构预测
分子动力学/计算量子化学
分子相互作用分析
后基因组学/系统生物学
系统生物学基础
大规模网络分析
基因芯片分析
生物系统动力学分析
2017-4-3
3
第一节 序列比对基础
2017-4-3
4
一切从序列比对开始:BLAST搜索
2017-4-3
5
“AB012771”查询结果
2017-4-3
6
相似序列比对情况
2017-4-3
7
序列比对是生物信息分析的基础
2017-4-3
8
设有两个序列:
GACGGATTAG,GATCGGAATAG
Alignment2:
GA—CGGATTAG GATCGGAATAG
Alignment1:
GACGGATTAG-
GATCGGAATAG
1、什么是序列比对(Alignment)
序列比对是指将多个序列中各个字符(碱基或氨基酸)进行对比排列,建立一种一一对应关系,并尽可能反映序列间的相似性。
Alignment:比对、对位排列、联配、对齐
2017-4-3
9
通过点矩阵进行序列比对“矩阵作图法” 或 “对角线作图”
在两个对角线方向上的连续点连接起来,就构成了一个比对方案
反向序列矩阵标记图
多个相同子序列的矩阵标记图
2017-4-3
10
2、序列比对计算的标准化处理
序列的表示问题:字母表和序列
序列的处理方法:编辑操作
序列相似性的评价:打分矩阵
1: A-TTCGAGCCT-
| | | | | | |
2: CGTTC- AGC- TA
2017-4-3
11
(1)序列表示问题——字母表和序列
将生物分子序列抽象为字符串,其中的字符取自特定的字母表。
ATTCGAGCCT
字母表
4字符DNA字母表:{A, C, G, T}
单字母氨基酸编码
扩展的遗传学字母表或IUPAC编码
上述字母表形成的子集
2017-4-3
12
符 号
含 义
说 明
G
G
Guanine
A
A
Adenine
T
T
Thymine
C
C
Cytosine
R
G or A
Purine
Y
T or C
Pyrimidine
M
A or C
Amino
K
G or T
Keto
S
G or C
Strong interaction (3 H bonds)
W
A or T
Weak interaction (2 H bonds)
H
A or C or T
Not-G
B
G or T or C
not-A
V
G or C or A
not-T(not-U)
D
G or A or T
not-C
N
G or A or T or C
Any
扩展的遗传学字母表或IUPAC编码
2017-4-3
13
氨基酸名称
英文缩写
简 写
氨基酸名称
英文缩写
简 写
甘氨酸
Gly
G
丝氨酸
Ser
S
丙氨酸
Ala
A
苏氨酸
Thr
T
缬氨酸
Val
V
天冬酰胺
Asn
N
异亮氨酸
Ile
I
谷酰胺
Gln
Q
亮氨酸
Leu
L
酪氨酸
Tyr
Y
苯丙氨酸
Phe
F
组氨酸
His
H
脯氨酸
Pro
P
天冬氨酸
Asp
D
甲硫氨酸
Met
M
谷氨酸
Glu
E
色氨酸
Trp
W
赖氨酸
Lys
K
半胱氨酸
Cys
C
精氨酸
Arg
R
20种标准氨基酸的英文简写
2017-4-3
14
(2)字符编辑操作-序列处理方法
字符编辑操作可将一个序列转化为一个新序列
GCATGACGAATCAG-
????? ?? ???
-TATGAC-AAACAGC
Match(a,a)字符匹配
Delete(a,-) 1序列删除1个字符a,或2插入空位
Replace(a,b)2序列字符b替换1序列字符a
Insert(-,b)1序列插入空位,或2删除1个字符b
2017-4-3
15
扩展的编辑操作
ACCGACAATATGCATA
? ? ? ? ?
ATAGGTATAACAGTCA
ACCGACAATATGCATA
?? ????????? ???
ACTGACAATATGGATA
第二条序列头尾颠倒
CTAGTCGAGGCAATCT
? ?
GAACAGCTTCGTTAGT
?
CTAGTCGAGGCAATCT
?? ????? ??????
C
您可能关注的文档
- 2015-2016学年高二地理湘教版必修3:第一章区域地理环境与人类活动本章整合详解.ppt
- 2015-2016学年高二生物北师大版必修3:2.1.3-2.1.4血糖的平衡体温的平衡详解.pptx
- 2015-2016学年高二生物北师大版必修3:3.1种群的相对稳定详解.pptx
- 2015-2016学年高二生物北师大版必修3:3.2群落的相对稳定详解.pptx
- 2015-2016学年高二生物北师大版必修3:4.1.1生态系统的结构详解.pptx
- 2015-2016学年高二生物北师大版必修3:4.1.5-4.1.6生态系统的相对稳定性生物圈是最大的生态系统详解.pptx
- 2015-2016学年黑龙江省佳木斯市第二中学高一下学期期中考试地理试题详解.doc
- 2015-2016学年黑龙江省大庆市第四中学高二下学期期中考试生物试题详解.doc
- 2015-2016届中考物理专题复习《专题1密度、压强、浮力》详解.ppt
- 2015-2016年初中生物会考试题及答案[整理]详解.doc
文档评论(0)