生物信息学填空题.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
填空题: 1、蛋白质结构数据来源 :①实验测定方法: X-ray 、 NMR 、Cryo-EM ②理论预测:同源建模、折叠识别、从头计算 2、一级数据库 :①一级核酸数据库: Genbank(美国)、EMBL (欧洲)、DDBJ(日本) NCBI ②一级蛋白质序列数据库: SWISS-PORT 、PIR 、 NCBI ③一级蛋白质结构数据库: PDB、 pfam 、 prosite 大分子序列格式: fasta 数据库基本文件格式: genbank 蛋白质分类数据库: SCOP、CATH 、 FSSP 二次数据库: GDB 、 Prosite、 TRANSFAC 3、本地软件 : Clustal-x 、 BioEdit 、 Mega、 sequencher、 spdbv、 Discovery-studio 4、本课程主要理论依据:  相似性、同源性、序列比对(  3D  结构比对)、数学方法、分子动 力、分子力学 5、基因鉴定三步骤 :①找到序列中的非编码区 (低复杂度区) ②找基因 ③鉴定找到的基因 6、主要的生物大分子数据: ① DNA :基因组序列、基因序列、 cDNA 、 EST、碱基修饰 DNA 功能模块 /位点(如启动子、剪接体、表达调控位点等) ②蛋白质:氨基酸组成、氨基酸序列、理化性质、原子坐标;二级结构、核体、结构域、功能域 /位点; 3D 结构 常见的生物信息数据记录格式:  FASTA 、GenBank、EMBL  、 PDB FASTA 格式:序列文件的第一行由大于符号 大头的任意文字说明,主要为标记序列用。 从第二行开始是序列本身, 标准核苷酸符号或氨基酸单字母符号, 通过核苷酸符号大小写均 可,而氨基酸一般用大写字母。文件中和每一行都不要超过 80 个字符(通常 60 个字符) GenBank  格式:序列名称、长度。日期;序列说明、编号、版本号;物种来源、学名、分类 学位置;相关文献作者、题目、刊物、日期;序列特征表;碱基组成;序列本身(每行 个) 二 .填空题  60 常用的三种序列格式: NBRF/PIR,FASTA 和 GDE 初级序列数据库: GenBank, EMBL 和 DDBJ 蛋白质序列数据库: SWISS-PROT 和 TrEMBL 4. 提供蛋白质功能注释信息的数据库: KEGG (京都基因和基因组百科全书)和 质信息资源) 5. 目前由 NCBI 维护的大型文献资源是 PubMed  PIR (蛋白 数据库常用的数据检索工具: Entrez, SRS, DBGET 常用的序列搜索方法: FASTA 和 BLAST 高分值局部联配的 BLAST 参数是 HSPs(高分值片段对) , E(期望值) 9. 多序列联配的常用软件: Clustal 蛋白质结构域家族的数据库有:Pfam, SMART 11. 系统发育学的研究方法有:表现型分类法,遗传分类法和进化分类法 12. 系统发育树的 构建方法: 距离矩阵法,最大简约法和最大似然法 13. 常用系统发育分析软件: PHYLIP 检测系统发育树可靠性的技术: bootstrapping 和 Jack-knifing 15. 原核生物和真核生物基因组中的注释所涉及的问题是不同的 16. 检测原核生物 ORF 的程序: NCBI ORF finder 17. 测试基因预测程序正确预测基因的能力的项目是 GASP(基因预测评估项目) 二级结构的三种状态: α螺旋, β折叠和 β转角 用于蛋白质二级结构预测的基本神经网络模型为三层的前馈网络,包括输入层,隐含层和输出层 通过比较建模预测蛋白质结构的软件有SWISS-PDBVIEWER ( SWISS — MODEL 网 站) 21. 蛋白质质谱数据搜索工具: SEQUEST 22. 分子途径最广泛数据库: KEGG 23. 聚类分析方法,分为有监督学习方法,无监督学习方法  24. 质谱的两个数据库搜索工具: 1、 SEQEST 和 Lutkefi 三大数据库:核酸序列数据库、蛋白质序列数据库、结构数据库 世界三大核酸序列数据库: GenBank、 EMBL-Bank 、 DDBJ 蛋白质序列数据库: Swiss-Prot、 TrEMBL 、UniProt 蛋白质结构数据库: PDB 、SCOP、 CATH 2、 GenBank 文献、提供了  提供的服务:提供了 Entrez BLAST 序列类似性检索。  浏览器、提供  PubMed  服务、免费检索条生物医学 3、进化树的四种构建方法:距离法(包括除权配对法和邻位相连法)独立元素法)包括简约法和似然法) 4、Blast 的方法及适用范围:核酸 blastn(nucle

文档评论(0)

明若晓溪 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档