- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
核酸蛋白序列比分对析
核酸\蛋白序列比对分析
生物技术 02级 021402198 曾彪
摘要 生物信息学——是一门新兴的交叉学科,是采用计算机技术和信息论方法研究蛋白质及核酸序列等各种生物信息的采集、存储、传递、检索、分析和解读的科学,是现代生命科学与计算机科学、数学、统计学、物理学和化学等学科相互渗透而形成的交叉学科。核酸与蛋白质序列分析是生物信息学的基本研究方法。核酸与蛋白质序列分析是生物信息学的基本研究方法。
关键词 核酸/蛋白质序列分析 生物信息数据与查询 序列比较 DNA芯片 质谱 隐马尔可夫模型
正文 人类基因组计划完成了人类基因组的测序与分析工作,也积累了大量的核酸和蛋白质序列数据,从而导致了分子数据库的建立。分子生物学家在此基础上依靠计算机进行核酸和蛋白质序列分析。
大量生物学实验的数据积累,形成了当前数以百计的生物信息数据库。它们各自按一定的目标收集和整理生物学实验数据,并提供相关的数据查询、数据处理。这些生物信息数据库可以分为一级数据库和二级数据库。一级数据库的数据都直接来源于实验获得的原始数据,只经过简单的归类整理和注释;二级数据库是在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步整理。国际上著名的一级核酸数据库有Genbank数据库、EMBL核酸库和DDBJ库等;蛋白质序列数据库有SWISS-PROT、PIR等;蛋白质结构库有PDB等。国际上二级生物学数据库非常多,它们因针对不同的研究内容和需要而各具特色,如人类基因组图谱库GDB、转录因子和结合位点库TRANSFAC、蛋白质结构家族分类库SCOP等等。
要在如此庞大的数据库中找到所需要的目标序列,必须建立数据库查询系统。数据库查询(也称为数据库检索)是指对序列、结构以及各种二次数据库中的注释信息进行关键词匹配查找。常用的数据库查询系统有Entrez, SRS等。数据库搜索是指通过特定的序列相似性比对算法,找出核酸或蛋白质序列数据库中与检测序列具有一定程度相似性的序列。常用的数据库搜索系统有BLAST 、FASTA和BLITZ 。
面对大批由测序仪产生的序列数据,通过序列分析,人们能够了解这些序列的生物学信息和意义。线性核酸序列的分析主要包括同源比较,读框分析,酶切位点查找,GC比例分析,序列翻译,引物设计等;蛋白质序列分析包括同源比较,疏水性分析,序列模体识别,结构域识别,高级结构预测等。
核酸序列分析
核酸序列的基本分析
1.测定分子质量、碱基组成、碱基分布等基本数值;
2.序列变换:反向序列、互补序列、互补反向序列;
3.限制性酶切分析:限制酶的所有信息,包括甲基化酶、相应的微生物来源、识别序列位点、裂解位点、甲基化特异性、酶的商业来源以及参考文献。
4.克隆测序的分析:测序峰图的查看、核酸序列中载体的识别和去除、其他人工序列的分析和去除
核酸序列的电子延伸---GenBank的UniGene数据库、意大利Tigem的EST Machine、EMBL的EST Cluster Project等
基因的电子表达谱分析---将待分析序列与EST数据库进行序列对库的检索,用与待分析核酸序列具有高同源性的EST序列所对应的组织来源进行推断,进而得到该基因的组织表达谱。SAGE数据库、UniGene、Tigem等。
核酸序列的电子基因定位分析---染色体定位。
通过序列标签STS数据库定位
利用UniGene/RH放射性杂交定位
直接利用基因组序列定位
cDNA对应的基因组序列分析---EST和cDNA的基因组序列查询了解该基因的基因组结构:外显子/内含子结构、转录调控区。
基于核酸序列对齐分析的功能预测
利用数据库的核酸序列的同源性分析
两条核酸序列之间的同源性分析
核酸序列之间的多重比对分析及进化分析
可读框架分析
1)cDNA序列的可读框架分析
2)基因组序列中的编码区/内含子结构分析
3)cDNA序列与基因组序列的对齐及显示,Sim4程序。
5)基因启动子及其他调控位点分析---启动子、增强子、转录因子结合位点、内含子与外显子。
6)重复序列分析
7)引物设计
蛋白质序列分析
1.蛋白质序列检索
2.蛋白质基本性质分析
氨基酸组分、分子质量、等电点
疏水性分析
3) 跨膜区分析
前导肽和蛋白质定位
卷曲螺旋分析
蛋白质功能预测
基于序列同源性分析的蛋白质功能预测。 Blast、Blast2、FASTA。
基于模体、结构位点、结构功能域的蛋白质功能预测
蛋白质结构预测
蛋白质二级结构预测
蛋白质三级结构预测——与已知结构的序列比较、同源模建、threading算法和折叠识别
DNA 芯片技术与脱氧核糖核酸序列分析
在分子生物学的
您可能关注的文档
最近下载
- 电力系统优化与调度软件:PLEXOS二次开发_(16).电力系统规划与运营.docx
- 民宿管家职业技能竞赛理论考试题库(含答案).docx
- 古代诗人名人柳永人物介绍PPT.pptx VIP
- 第5章独立第三方B2B型医药电子市场.ppt VIP
- 北京市西城区2024年小升初考试语文试卷含答案.doc VIP
- AI技术在化学课堂的应用效果研究教学研究课题报告.docx
- HG∕T 5809-2020 浸胶芳纶帆布.pdf
- 网络安全防御能力评价体系框架.pdf VIP
- 2024年嘉兴国际商务区投资建设有限公司人员招聘笔试备考题库及答案解析.docx
- 统编《中国历史》八年级下册教材详细分析和教学策略.pptx
文档评论(0)