- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
填空题:
1、蛋白质结构数据来源 :①实验测定方法: X-ray 、 NMR 、Cryo-EM ②理论预测:同源建模、折叠识别、从头计算
2、一级数据库 :①一级核酸数据库: Genbank(美国)、EMBL (欧洲)、DDBJ(日本) NCBI
②一级蛋白质序列数据库: SWISS-PORT 、PIR 、 NCBI
③一级蛋白质结构数据库: PDB、 pfam 、 prosite
大分子序列格式: fasta
数据库基本文件格式: genbank
蛋白质分类数据库: SCOP、CATH 、 FSSP
二次数据库: GDB 、 Prosite、 TRANSFAC
3、本地软件 : Clustal-x 、 BioEdit 、 Mega、 sequencher、 spdbv、 Discovery-studio
4、本课程主要理论依据:
相似性、同源性、序列比对(
3D
结构比对)、数学方法、分子动
力、分子力学
5、基因鉴定三步骤 :①找到序列中的非编码区 (低复杂度区) ②找基因 ③鉴定找到的基因
6、主要的生物大分子数据: ① DNA :基因组序列、基因序列、 cDNA 、 EST、碱基修饰 DNA 功能模块 /位点(如启动子、剪接体、表达调控位点等)
②蛋白质:氨基酸组成、氨基酸序列、理化性质、原子坐标;二级结构、核体、结构域、功能域 /位点; 3D 结构
常见的生物信息数据记录格式:
FASTA 、GenBank、EMBL
、 PDB
FASTA 格式:序列文件的第一行由大于符号 大头的任意文字说明,主要为标记序列用。
从第二行开始是序列本身, 标准核苷酸符号或氨基酸单字母符号, 通过核苷酸符号大小写均
可,而氨基酸一般用大写字母。文件中和每一行都不要超过 80 个字符(通常 60 个字符)
GenBank
格式:序列名称、长度。日期;序列说明、编号、版本号;物种来源、学名、分类
学位置;相关文献作者、题目、刊物、日期;序列特征表;碱基组成;序列本身(每行
个)
二 .填空题
60
常用的三种序列格式: NBRF/PIR,FASTA 和 GDE
初级序列数据库: GenBank, EMBL 和 DDBJ
蛋白质序列数据库: SWISS-PROT 和 TrEMBL
4. 提供蛋白质功能注释信息的数据库: KEGG (京都基因和基因组百科全书)和
质信息资源) 5. 目前由 NCBI 维护的大型文献资源是 PubMed
PIR (蛋白
数据库常用的数据检索工具: Entrez, SRS, DBGET
常用的序列搜索方法: FASTA 和 BLAST
高分值局部联配的 BLAST 参数是 HSPs(高分值片段对) , E(期望值) 9. 多序列联配的常用软件: Clustal
蛋白质结构域家族的数据库有:Pfam, SMART
11. 系统发育学的研究方法有:表现型分类法,遗传分类法和进化分类法 12. 系统发育树的
构建方法: 距离矩阵法,最大简约法和最大似然法 13. 常用系统发育分析软件: PHYLIP
检测系统发育树可靠性的技术: bootstrapping 和 Jack-knifing 15. 原核生物和真核生物基因组中的注释所涉及的问题是不同的
16. 检测原核生物 ORF 的程序: NCBI ORF finder
17. 测试基因预测程序正确预测基因的能力的项目是 GASP(基因预测评估项目)
二级结构的三种状态: α螺旋, β折叠和 β转角
用于蛋白质二级结构预测的基本神经网络模型为三层的前馈网络,包括输入层,隐含层和输出层
通过比较建模预测蛋白质结构的软件有SWISS-PDBVIEWER ( SWISS — MODEL 网
站) 21. 蛋白质质谱数据搜索工具: SEQUEST 22. 分子途径最广泛数据库: KEGG
23. 聚类分析方法,分为有监督学习方法,无监督学习方法
24. 质谱的两个数据库搜索工具:
1、 SEQEST 和 Lutkefi 三大数据库:核酸序列数据库、蛋白质序列数据库、结构数据库
世界三大核酸序列数据库: GenBank、 EMBL-Bank 、 DDBJ
蛋白质序列数据库: Swiss-Prot、 TrEMBL 、UniProt 蛋白质结构数据库: PDB 、SCOP、
CATH
2、 GenBank 文献、提供了
提供的服务:提供了 Entrez
BLAST 序列类似性检索。
浏览器、提供
PubMed
服务、免费检索条生物医学
3、进化树的四种构建方法:距离法(包括除权配对法和邻位相连法)独立元素法)包括简约法和似然法)
4、Blast 的方法及适用范围:核酸 blastn(nucle
文档评论(0)