- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学复习提纲(根据老师提供的提纲提供自己的理解,仅供参考
生物信息学复习提纲(根据老师 提供的提纲提供自己的理解,仅供参考)
各种 omics
分子生物学中,组学(Omics)主要包括基因组学 (Genomics),蛋白组学 (Proteinomics),
代谢组学 (Metabolomics),转录组学(transcriptomics),脂类组学 (lipidomics), 免疫组
学 (Immunomics),糖组学 (glycomics )和 RNA 组学(RNomics)学等。
NGS 测序体系及相关 seq、,如 RNA-seq。测序深度、数据类型及拼接、组装算法、工
具等
测序得到的碱基总量 (bp)与基因组大小 (Genome)的比值,它是评价测序量的指标之一
非编码 RNA
intron, exon 识别
同源基因/蛋白
indel 插入缺失标记,指的是两种亲本在全基因中的差异,一种亲本相对于另一个亲本
的基因组中有一定数量的核苷酸插入或损失。
dot plot 点阵图在序列比对上的应用意义。
通过点阵作图的方式,直观地看出两条序列的相似性,由该算法提供的相似片段其实是相同
片断,所以该算法不能提供相似片段在统计学意义上的相似性。
sequence profile
由多序列对比的全部信息构建的序列特征表,图中列出所有氨基酸残基替代、插入、缺失等
情况。
phylogentics
系统发生学:研究生物进化规律以及物种间沁源关系的学科。
genbank Flatfile 生物信息学的平面文本格式,基因库。
fasta 格式 fasta 格式的第一行是描述行,第一个字符必须是 “” 随后的行是序列本身,
其中的字符由标准的氨基酸和核酸代码表示,不允许有空行,回车符不会影响,小写字符全
部转换为大写字符。
Refseq 索引号码 参考序列数据库 (练习,老师给的练习做一下)
了解 3 大核酸数据库以及 uniprot 数据库 (swissprot)、基因组数据库,特殊数据库
OMIM、KEGG 等
NCBI、DDBJ、EBI 三大核酸数据库。
Uniprot 蛋白质数据库。Swissprot 高质量的人工注释的蛋白质数据库
OMIM 为 “0nline Mendelian Inheritance in Man”的简称,意即 “在线 《人类孟德尔遗传》”
或 “网上 《人类孟德尔遗传》”。持续更新的关于人类基因和遗传紊乱的数据库。 主要着
眼于可遗传的或遗传性的基因疾病,包括文本信息和相关参考信息、序列纪录、图谱和相关
其他数据库。
KEGG 是了解高级功能和生物系统 (如细胞、 生物和生态系统),从分子水平信息,尤其
是大型分子数据集生成的基因组测序和其他高通量实验技术的实用程序数据库资源,[1]
由日本京都大学生物信息学中心的Kanehisa 实验室于1995 年建立。是国际最常用的生物信
息数据库之一,以“理解生物系统的高级功能和实用程序资源库”著称。
entrez 和 srs 的检索方法
Entrez NCBI 的检索系统
SRS 是EBI 的一种通用生物信息学数据集成软件系统
重要的生物学数据库,核酸、蛋白、医学、途径等
序列数据库搜索常用程序有哪些?其统计分值 p-value 和 E-value 表示什么含义?
E-value 代表随机比较得到的分数不低于实际比较的分数的概率,越小越严谨。或者解释为
期望值,它描述了在一次数据库搜索中随机条件下期望发生的得分大于S 的不同比对的数
目。
核酸的 Blast 搜索基本流程
数据库搜索常用的数据库有哪些?
影响 blast 数据库搜索的因素有哪些?
什么是低复杂度区域(LCR),搜索时对其屏蔽有何意义?
蛋白和核酸均包含一些区域,在进行序列比对的时候,这些区域将产生令人困惑的结果。对
包含lcrs 的序列进行对比是不合适的,因为它们不符合残基-残基序列守恒模型,使用blast
进行序列对比时可以对其自动进行屏蔽。
PSI-BLAST 和传统 BLAST 的区别,它的基本流程是怎样的?
Psi-blast ————位点特异性反复比较blast 其特色是每次利用构建的profile 在数据库里面
搜索,利用搜索的结果重新构建新的profile,如此重复直到没有新的结果产生为止。Psi-blast
先用带空位的blast 进行搜索,将获得的序列通过多序列对比来得到第一个profile。
它的作用在于寻找远源相关的蛋白质序列,对于蛋白质的相似序列的寻找比常规的blastp
更加敏感。
什
文档评论(0)