- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物信息学是一门交叉学科, 包含了生物信息的获取、加工、存储、分配、分 析、解释等在内的所有方面, 它综合运用数学、计算机科学和生物学等的各种 工具来阐明和理解大量数据所包含的生物学意义。生物信息学宗旨在揭示基因 组信息结构的复杂性及遗传语言的根本规律。从生物分子获得和挖掘深层次生 物学知识。
人类基因组计划(HGP):获得遗传图、物理图、序列图、转录图;终极目标: 阐明人类基因组全部 DNA 序列;识别基因;建立储存这些信息的数据库;开发 数据分析工具;研究 HGP 实施所带来的伦理、法律和社会问题。其中我国承担 了人类 3 号染色体短臂。
记录:一个数据库记录一般由两部分组成:原始序列数据和描述这些数据生物 学信息的注释。
冗余:在一个数据库存在着多个相同的项,如两个或者更多的记录中有一个相 同序列
asta 格式开始于一个标识符:,然后是一行描述。
enBank 格式:每个基因描述可有多个描述行,包含一行以 LOUCUS 开头描述行, 基因序列以 ORIGN 开头,以//结尾。
EMBL:入口标识符 ID,序列开始标识符 SQ,结束是//。
数据库的特点:①数据库是可以检索的,即具有检索功能;②数据库应该是定 时更新的,即不断有新版内容发布;③数据库是交叉引用的,特别是在互联网 时代,数据库应该通过超链接与其他数据库相连。
EST 序列:表达序列标签对 cDNA 文库测序得到的,是转录的 DNA 序列。
STS 序列:序列标签位点染色体上位置已定的、核苷酸序列已知的、且在基因 组中只有一份拷贝的 DNA 短片断,(200bp-500bp)。STS 序列标签位点是基因组 上定位明确、作为界标并能通过 PCR 扩增被唯一操作的短的、单拷贝 DNA 序列, 用于产生作图位点。
序列:基因组概览测序基因组 DNA 克隆的一次性部分测序得到的序列。
序列:高通量基因组序列
三大数据库:
NCBI(GenBank):美国生物技术中心,建立了一系列生物信息数据和各种服务。 EMBL:欧洲分子生物学实验室。
DDBJ:日本遗传研究所。
同源性基因系指起源于同一祖先但序列已经发生变异的基因成员。基因同源性 只有“是”和“非”的区别,是一种质的判断。
直系同源基因:分布在不同物种间的同源基因又称直系同源基因。
旁系同源基因:同一物种的同源基因则称旁系同源基因(水平基因), 水平基 因由重复后趋异产生。
一致性:序列中同一碱基位置的相同的碱基成员, 或者蛋白质的同一氨基酸位 置的相同的氨基酸成员的百分比。
程序名查询序列数据库Blastn核酸核酸Blastp蛋白质
程序名
查询序列
数据库
Blastn
核酸
核酸
Blastp
蛋白质
蛋白质
Blastx
核酸
蛋白质
Tblastn
蛋白质
TBlastx
核酸
核酸
核酸
相似性:序列中同一位置相同或相似序列的百分比。如同源蛋白质的氨基酸序
列中一致性氨基酸和可取代氨基酸所占的比例。可取代氨基酸系指具有相同性
质如极性氨基酸或非极性氨基酸的成员, 它们之间的代换不影响蛋白质(或酶)
的生物学功能。
相似性和同源性关系:一般来说序列间的相似性越高的话,是同源序列的可能
性就更高,所以经常可以通过序列的相似性来推测序列是否同源。
序列比对:确定两个或多个序列之间的相似性以至于同源性,而将它们按照一
定的规律排列。任务:通过比较生物分子序列,发现它们的相似性,找出序列
之间共同的区域,同时辨别序列之间的根本差异。
相似性:可能是核酸/氨基酸序列的相似、可能是结构的相似、可能是功能的
相似
主要的 blast 程序:
搜索方法
核酸序列搜索逐一核酸数据库中的序列
蛋白质序列搜索逐一蛋白质数据库中的序列
核酸序列 6 框翻译成蛋白质序列后和蛋白质数据库中的序列逐一搜索。
蛋白质序列和核酸数据库中的核酸序列 6 框翻译后的蛋白质序列逐一比对
核酸序列 6 框翻译成蛋白质序列,再和核酸数据库中的核酸序列 6 框翻译
一进行比对。
Score:使用打分矩阵对匹配的片段进行打分,这是对各对氨基酸残基(或碱基) 打分求和的结果,一般来说,匹配片段越长、相似性越高则 Score 值越大。 E value:在相同长度的情况下,两个氨基酸残基(或碱基)随机排列的序列进 行打分,得到上述 Score 值的概率的大小。E 值越小表示随机情况下得到该 Score 值的可能性越低。
分子钟:某一蛋白在不同物种间的取代数与所研究物种间的分歧时间接近正线 性关系,进而将分子水平的这种恒速变异称为“分子钟”。
中性学说:突变大多数是中性的,中性突变通过随机的遗传漂变在群体里固定下 来,分子进化是遗传漂变的结果,在分子进化上自然选择不起作用。
分子进化/系统发育树的研究目的:①物种分类及关系:从物种的一些分子特 性出发,构建
文档评论(0)