南京工业大学生物信息学期末复习.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
南京工业大学生物信息学期末复习

生工1202生物信息学考试参考资料 1、生物信息学的主要应用有哪些? ①生物信息学数据库:数据库建立、数据库整合和数据挖掘 ②序列分析:序列比对、基因序列注释 ③其他:比较基因组学、基因和蛋白质的表达分析、生物芯片大规模功能表达谱的分析、蛋白质结构的预测、蛋白质与蛋白质的相互作用、生物系统模拟、代谢网络建模分析、计算机进化生物学、生物多样性研究、合成生物学 2、生物学数据库有哪些特点? ①数据库的更新速度不断加快、数据量呈指数增长 ②数据库使用频率增长更快 ③数据库的复杂程度不断增加 ④数据库网络化 ⑤面向应用 ⑥先进的软硬件配置 3、一级数据库和二级数据库的区别是什么?有哪些一级数据库和二级数据库? 一级数据库属于档案数据库,库中的主要内容是来源于实验室操作所得到的原始数据结果;二级数据库则是在一级数据库的信息基础上进行了计算加工处理并增加了许多人为的注释而构成的 一级数据库:核酸序列数据库GenBank、EMBL、DDBL及蛋白质数据库PDB 二级数据库:NCBI的RefSeq数据库 4、数据库的Fasta、Flat file和XML格式各有何特点? (1)FASTA 序列格式包括三个部分:(书上没有PPT第二章第19-20页) 1.在注释行的第一列用字符“”标识,后面是序列的名字和来源; 2.标准的单字符标记的序列; 3.可选的“*”表示序列的结束,它可能出现也可能不出现,但它是许多序列分析程序正确读取序列所必须的。 提供了从一个窗口到另一个窗口非常方便的拷贝途径,序列中没有数字或其他非字符。 从第二行开始是序列本身,标准核苷酸符号(大小写均可)或氨基酸单字母符号(大写)。 (2)平面文件格式—Flat File 纯文本文件、通用性好、检索复杂,冗余字段较多,大容量数据库难以处理 (3)XML格式(PPT第二章第29、32页) 一个XML文件代表一个嵌套的信息树。树中的每一个节点能包含像一串子节点或者一些属性这样的数据,并且一个XML文件始于根节点。一个XML文件有一个文本,在文本中每一个节点的内容及其子节点被一对相互封闭的标签划定。形式上类似html。 5、GenBank数据库中的GenBank条目包含哪些内容?请结合GenBank中的具体的序列信息加以说明。 GenBank数据库(包括NCBI核酸和蛋白质序列数据库)中条目格式如下:给出描述每一个序列的信息,包括文献参考、序列的功能信息、mRNA和编码区域的位置,以及重要突变的位置。 例: 这些序列信息以字段的形式进行组织,每一行最前端都有一个标识符。 在某些条目中,标识符可能缩写成两个字母(例如RF代表reference),某些字段可能还有次级字段。 计算机程序中的序列条目位于标识符“ORIGIN”和“//”之间。这些字段提供的信息可以参见网页/Sitemap/samplerecord.html 序列每行前面标有数字,以显示片断位置。序列计数或序列校检求和的值可被计算机程。 用来鉴定序列成分,所以除非程序本身也改变计数,序列计数是不能被改变的。 GenBank序列格式通常需要改变以适应序列分析软件。 蛋白质序列数据库有哪些? SWISS-PROT、PIR 7、序列比对在什么情况下选择核苷酸序列?在什么情况下选择蛋白质序列? 核苷酸序列:①在确认给定DNA序列和DNA数据库中的序列的一致性时②在搜索多态性时③在分析所克隆的cDNA片段的一致性时 蛋白质序列:由于蛋白质序列比DNA所含信息多,所以除以上情况外用蛋白质序列 8、请比较同源性、同一性和相似性三个概念。 同源性:是指从某个共同祖先经趋异进化而形成的不同序列,也就是从一些数据中推断出的两个基因在进化上具有共同祖先的结论,是质的判断 同一性:是指两序列在同一位点核苷酸或氨基酸残基完全相同的序列比例 相似性:两序列间直接的数量关系,如部分相同,相似的百分比或其他一些合适的度量 9、举例说明何为直系同源,何为旁系同源? 10、总结BLAST比对程序家族的主要程序,如何选择? 解读BLAST程序的比对结果所代表的含义。 (1)该搜索的详细情况,包括BLAST搜索的类型、所搜索的数据库的描述、查询内容和分类连接(taxonomy reporter) (2)显示的是数据库中与查询序列相匹配的项的简明图形。每一条彩色带表示数据库中与查询序列相匹配的蛋白质或核酸序列,不同颜色表示不同高低的得分。 (3)与查询序列相匹配的数据库中的序列列表。每一条序列包括其Score(bits)、E value及该序列在相应数据库中的链接。 (4)查询序列与目标序列之间的双序列比对情况。Score为位记分分数;Expect为期望值;Posi

您可能关注的文档

文档评论(0)

haihang2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档