生物信息学填空题.docxVIP

下载本文档

4
0
约2.86千字
约 2页
2020-02-12 发布于江苏
举报
版权申诉

生物信息学填空题.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

填空题： 1、蛋白质结构数据来源：①实验测定方法： X-ray 、 NMR 、Cryo-EM ②理论预测：同源建模、折叠识别、从头计算 2、一级数据库：①一级核酸数据库： Genbank（美国）、EMBL （欧洲）、DDBJ（日本） NCBI ②一级蛋白质序列数据库： SWISS-PORT 、PIR 、 NCBI ③一级蛋白质结构数据库： PDB、 pfam 、 prosite 大分子序列格式： fasta 数据库基本文件格式： genbank 蛋白质分类数据库： SCOP、CATH 、 FSSP 二次数据库： GDB 、 Prosite、 TRANSFAC 3、本地软件： Clustal-x 、 BioEdit 、 Mega、 sequencher、 spdbv、 Discovery-studio 4、本课程主要理论依据：相似性、同源性、序列比对（ 3D 结构比对）、数学方法、分子动力、分子力学 5、基因鉴定三步骤：①找到序列中的非编码区（低复杂度区） ②找基因 ③鉴定找到的基因 6、主要的生物大分子数据： ① DNA ：基因组序列、基因序列、 cDNA 、 EST、碱基修饰 DNA 功能模块 /位点（如启动子、剪接体、表达调控位点等） ②蛋白质：氨基酸组成、氨基酸序列、理化性质、原子坐标；二级结构、核体、结构域、功能域 /位点； 3D 结构常见的生物信息数据记录格式： FASTA 、GenBank、EMBL 、 PDB FASTA 格式：序列文件的第一行由大于符号大头的任意文字说明，主要为标记序列用。从第二行开始是序列本身，标准核苷酸符号或氨基酸单字母符号，通过核苷酸符号大小写均可，而氨基酸一般用大写字母。文件中和每一行都不要超过 80 个字符（通常 60 个字符） GenBank 格式：序列名称、长度。日期；序列说明、编号、版本号；物种来源、学名、分类学位置；相关文献作者、题目、刊物、日期；序列特征表；碱基组成；序列本身（每行个）二 .填空题 60 常用的三种序列格式： NBRF/PIR,FASTA 和 GDE 初级序列数据库： GenBank， EMBL 和 DDBJ 蛋白质序列数据库： SWISS-PROT 和 TrEMBL 4. 提供蛋白质功能注释信息的数据库： KEGG （京都基因和基因组百科全书）和质信息资源） 5. 目前由 NCBI 维护的大型文献资源是 PubMed PIR （蛋白数据库常用的数据检索工具： Entrez， SRS， DBGET 常用的序列搜索方法： FASTA 和 BLAST 高分值局部联配的 BLAST 参数是 HSPs（高分值片段对）， E（期望值） 9. 多序列联配的常用软件： Clustal 蛋白质结构域家族的数据库有：Pfam， SMART 11. 系统发育学的研究方法有：表现型分类法，遗传分类法和进化分类法 12. 系统发育树的构建方法：距离矩阵法，最大简约法和最大似然法 13. 常用系统发育分析软件： PHYLIP 检测系统发育树可靠性的技术： bootstrapping 和 Jack-knifing 15. 原核生物和真核生物基因组中的注释所涉及的问题是不同的 16. 检测原核生物 ORF 的程序： NCBI ORF finder 17. 测试基因预测程序正确预测基因的能力的项目是 GASP（基因预测评估项目）二级结构的三种状态： α螺旋， β折叠和 β转角用于蛋白质二级结构预测的基本神经网络模型为三层的前馈网络，包括输入层，隐含层和输出层通过比较建模预测蛋白质结构的软件有SWISS-PDBVIEWER （ SWISS — MODEL 网站） 21. 蛋白质质谱数据搜索工具： SEQUEST 22. 分子途径最广泛数据库： KEGG 23. 聚类分析方法，分为有监督学习方法，无监督学习方法 24. 质谱的两个数据库搜索工具： 1、 SEQEST 和 Lutkefi 三大数据库：核酸序列数据库、蛋白质序列数据库、结构数据库世界三大核酸序列数据库： GenBank、 EMBL-Bank 、 DDBJ 蛋白质序列数据库： Swiss-Prot、 TrEMBL 、UniProt 蛋白质结构数据库： PDB 、SCOP、 CATH 2、 GenBank 文献、提供了提供的服务：提供了 Entrez BLAST 序列类似性检索。浏览器、提供 PubMed 服务、免费检索条生物医学 3、进化树的四种构建方法：距离法（包括除权配对法和邻位相连法）独立元素法）包括简约法和似然法） 4、Blast 的方法及适用范围：核酸 blastn(nucle