- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
生工1202生物信息学考试参考资料
1、生物信息学的主要应用有哪些?
①生物信息学数据库:数据库建立、数据库整合和数据挖掘
②序列分析:序列比对、基因序列注释
③其他:比较基因组学、基因和蛋白质的表达分析、生物芯片大规模功能表达谱的分析、蛋白质结构的预测、蛋白质与蛋白质的相互作用、生物系统模拟、代谢网络建模分析、计算机进化生物学、生物多样性研究、合成生物学
2、生物学数据库有哪些特点?
①数据库的更新速度不断加快、数据量呈指数增长
②数据库使用频率增长更快
③数据库的复杂程度不断增加
④数据库网络化
⑤面向应用
⑥先进的软硬件配置
3、一级数据库和二级数据库的区别是什么?有哪些一级数据库和二级数据库?
一级数据库属于档案数据库,库中的主要内容是来源于实验室操作所得到的原始数据结果;二级数据库则是在一级数据库的信息基础上进行了计算加工处理并增加了许多人为的注释而构成的
一级数据库:核酸序列数据库GenBank、EMBL、DDBL及蛋白质数据库PDB
二级数据库:NCBI的RefSeq数据库
4、数据库的Fasta、Flatfile和XML格式各有何特点?
(1)FASTA序列格式包括三个部分:(书上没有PPT第二章第19-20页)
1.在注释行的第一列用字符“”标识,后面是序列的名字和来源;
2.标准的单字符标记的序列;
3.可选的“*”表示序列的结束,它可能出现也可能不出现,但它是许多序列分析程序正确读取序列所必须的。
提供了从一个窗口到另一个窗口非常方便的拷贝途径,序列中没有数字或其他非字符。
从第二行开始是序列本身,标准核苷酸符号(大小写均可)或氨基酸单字母符号(大写)。
(2)平面文件格式—FlatFile
纯文本文件、通用性好、检索复杂,冗余字段较多,大容量数据库难以处理
(3)XML格式(PPT第二章第29、32页)
一个XML文件代表一个嵌套的信息树。树中的每一个节点能包含像一串子节点或者一些属性这样的数据,并且一个XML文件始于根节点。一个XML文件有一个文本,在文本中每一个节点的内容及其子节点被一对相互封闭的标签划定。形式上类似html。
5、GenBank数据库中的GenBank条目包含哪些内容?请结合GenBank中的具体的序列信息加以说明。
GenBank数据库(包括NCBI核酸和蛋白质序列数据库)中条目格式如下:给出描述每一个序列的信息,包括文献参考、序列的功能信息、mRNA和编码区域的位置,以及重要突变的位置。
LOCUSnameoflocus,lengthandtypeofsequence,
classificationoforganism,dataofentry
DEFINITIONdesicriptionofentry
ACCESSIONaccessionnumberoforiginalsource
KEYWORDSkeywordsforcrossreferencingthisentry
SOURCEsourceorganismofDNA
ORGANISMdescriptionoforganism
REFERENCE
COMMENTbiologicalfunctionofdatabaseinformation
FEATURESinformationaboutsequencebybasepositionorrangeofpositions
sourcerangeofsequence,sourceorganism
misc_signalrangeofsequence,typeoffunctionorsignal
mRNArangeofsequence,mRNA
CDSrangeofsequence,proteincodingregion
intronrangeofsequence,positionofintron
mutationsequenceposition,changeinsequenceformutation
BASECOUNTcoun
文档评论(0)