- 1、本文档共57页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
三大基因数据库之间的关系 生物信息学数据库资源 蛋白质数据库 蛋白质序列数据库 PIRPIR是一个全面的蛋白质序列数据库,它是由美国生物医学基金会NBRF、日本的国际蛋白质信息数据库JIPID和德国的慕尼黑蛋白质序列信息中心MIPS合作建立和维护的。PIR的网址是:/。 SwissProt该数据库由瑞士日内瓦大学于1986年创建,目前由瑞士生物信息学研究所和欧洲生物信息学研究所EBI共同维护和管理。数据库网址是:/。 蛋白质结构数据库 PDBPDB是目前最主要的蛋白质分子结构数据库,目前由美国RCSB管理;以文本格式存放数据,包括原子坐标、物种来源、测定方法、提交者信息、一级结构、二级结构等。PDB的网址是:/pdb/。 基因组 数据库 蛋白质 序列 数据库 蛋白质 结构 数据库 DDBJ EMBL GenBank PIR PDB SWISS-PROT 生物分子数据的存储与获取 数据库! 搜索! 基因组序列分析 什么是序列分析? 拿到一个基因/蛋白质序列, 我能做什么? 在数据库中进行序列相似性搜索 序列组成/分子量/等电点---初级分析 酶切位点分析(载体构建) 基因结构分析/启动子序列分析 Motif的寻找与序列的模式识别(含跨膜区的预测等) 亚细胞定位 功能域(domain)预测 序列分析的内容 -----为了功能的分析 序列比对 序列比对两个序列的比对是指这两个序列中各个字符的一种一一对应关系,或字符的对比排列。 分类:双比对,全局比对,局部比对,多序列比对。 AAGCTTAACGT AATCTTAACGT 序列比对 序列比对两个序列的比对是指这两个序列中各个字符的一种一一对应关系,或字符的对比排列。 分类:双比对,全局比对,局部比对,多序列比对。 AAGCTTAACGT AATCTTAACGT 几个重要的概念:相似性,一致性,同源性 序列的相似性 相似性(similarity) 是指一种很直接的数量关系。比如说,A序列和B序列的相似性是80%,或者4/5。这是个量化的关系。 一致性(identity): 两个蛋白质有一定数量的氨基酸在排比的位点上是相同的,即如果38个氨基酸的蛋白质中15个位点相同,我们说它们一致性为39.4%. MSDTPSTGFSIIHPTSSEGQVPPPRHLSLTHPVVAKRISFYKSG -------------PRNGTIKIYENPARTFTRPYSAKNITIYKEND 所以, 相似性的数值一定比一致性的要( ) 大 or 相等 or 小 同源性(homology): 指从一些数据中推断出的两个基因或蛋白质序 列具有共同祖先的结论,属于质的判断。 就是说A和B的关系上,只有是同源序列,或者 非同源序列两种关系。而说A和B的同源性为80%都 是不科学的。 生物序列的同源性 相似性和同源性关系 一般来说,序列间的相似性越高的话,它们是同源序列的可能性就更高。 注意不要等价混用这两个名词。 A序列和B序列的同源性为80%,记住这种说法是错误的!! 主要的blast程序 程序名 查询序列 数据库 搜索方法 Blastn 核酸 核酸 核酸序列搜索逐一核酸数据库中的序列 Blastp 蛋白质 蛋白质 蛋白质序列搜索逐一蛋白质数据库中的序列 Blastx 核酸 蛋白质 核酸序列翻译成蛋白质序列后和蛋白质数据库中的序列逐一搜索。 Tblastn 蛋白质 核酸 蛋白质序列和核酸数据库中的核酸序列翻译后的蛋白质序列逐一比对。 TBlastx 核酸 核酸 核酸序列翻译成蛋白质序列,再和核酸数据库中的核酸序列翻译成的蛋白质序列逐一进行比对。 Blastn1的作用: ①对于已知的基因,可以分析其相似基因;②对于未知的基因片段,可以分析其属于什么基因。 Blastn2的作用: 对于新基因,可以了解基因的结构特征, 5-UTR和3-UTR 的大小. Blastp的作用: ①对于已知的蛋白,可以分析其相似蛋白;②对于未知的蛋白片段,可以分析其属于什么蛋白。 Blastx: ①分析你的基因编码什么产物?②分析你的基因是否是新基因? tBLASTn的作用: 已知一种蛋白序列,在另一物种中进行其同源蛋白基因的电子克隆(in silico cloning); 寻找一个新的蛋白质序列(如双向电泳得到的)是否已有核酸序列,是否可以克隆。 基因表达数据分析与处理 基因芯片 应用: 测序、表达谱分析、基因表达差异分析 生物信息学和基因芯片 生物信息学 基因芯片 促进 丰富 提取什么信息 如何提取信息 如何处理和利用信息 确定芯片检测目标 芯片
您可能关注的文档
- 基于Matlab的数字水印设计——基于空域的水印实现讲述.docx
- 解剖学之和骨学总论课题.ppt
- 生物竞赛辅导1-细胞生物学汇总.ppt
- 基于MedLDA的多源数据滑坡识别20150924何湜讲述.ppt
- 解剖-眼课题.ppt
- 生物竞赛辅导--植物生理汇总.ppt
- 基于OpenCV的车道线实时检测讲述.ppt
- 解剖-运动系统骨学课题.ppt
- 生物竞赛南京大学夏令营人体及动物生理专题汇总.ppt
- 基于Oracle数据库的云计算解决方案讲述.pptx
- 2025中国冶金地质总局所属在京单位高校毕业生招聘23人笔试参考题库附带答案详解.doc
- 2025年01月中国人民大学文学院公开招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024黑龙江省农业投资集团有限公司权属企业市场化选聘10人笔试参考题库附带答案详解.pdf
- 2025汇明光电秋招提前批开启笔试参考题库附带答案详解.pdf
- 2024中国能建葛洲坝集团审计部公开招聘1人笔试参考题库附带答案详解.pdf
- 2024吉林省水工局集团竞聘上岗7人笔试参考题库附带答案详解.pdf
- 2024首发(河北)物流有限公司公开招聘工作人员笔试参考题库附带答案详解.pdf
- 2023国家电投海南公司所属单位社会招聘笔试参考题库附带答案详解.pdf
- 2024湖南怀化会同县供水有限责任公司招聘9人笔试参考题库附带答案详解.pdf
- 2025上海烟草机械有限责任公司招聘22人笔试参考题库附带答案详解.pdf
文档评论(0)