生物信息学课件L1.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物信息学课件L1.ppt

* 序列、结构、功能这三种生物信息学分析不是相互独立的。比如蛋白质结构预测首先依赖于序列比对的结果;而基因表达谱分析则要用到序列分析中的创建系统发育树的方法;序列分析中的的启动子预测则与功能分析中的共表达基因有关系。等等 * 生物信息学尽管很强大,但我们还是不能过分依赖生物信息分析结果,或对结果报有过高的期望值。 Bioinformatics and experimental biology are independent, but complementary.生物信息学分析依赖于由实验科学所产生的原始数据,做为回报,它对实验数据提供有用的分析解释以便于进一步的实验研究.生物信息学预测不能做为任何理论的正式的证据,它们不能取代传统实验科学中真实的假设检验。 Quality limitation: 高通量分析中的序列数据经常有错。如果序列是错的或者对它的注释是错的,那么随后的分析结果都会出现误导。因此我们必须对生物信息学的作用有一个客观真实的看法。 尽管有缺陷,但生物信息学还是有很大的发展前景。生物信息学的发展前景是研究致力于对一个细胞内的所有基因产物的功能及相互作用进行描述。这需要将生物学知识与很多复杂的数学及统计学工具进行整合,利用数学模型来模拟各种细胞内的反应与相互作用。这种全细胞过程的分子模拟被称为系统生物学研究。到达这一目标则意味着我们向着全面理解生命系统迈进了一大步。因此,对于生物信息学研究来说,这是一个令人兴奋的历史时期。 * * * * 原始数据库由原始的生物学数据组成,比如科研团体提交的原始序列数据或结构数据文档;二级数据库存储的是经常的计算加工或手工注释加工的数据;专门数据库是为满足特定研究需要所建立的数据库。 * 在其主页面的右侧点击2010 database Issue, 就可以进入这一期的文章列表。 * 目前NAR的文献都可以免费浏览。除了这些文献外,Database issue还提供公共可接入数据库的网址。这些可接入的公共数据库数量在逐年增加。04年提供了548个数据库,05年提供了719个数据库,06年提供了858个数据库的接入网址,07年是968个,08年是1078个, 09年1170个,10年1230个。 * * 在每一类可能还有更小的分类。最终则是对收录的具体数据库的描述,并给出其链接网址。 * * * * * * * * * EST是转录本片段,cDNA文库中单次读取的300-500bp长的序列,大量的EST可代表特定组织或特定发育时期基因表达情况。 STS是基因组中一些unique的短序列,常用于基因组作图物理图谱的创建。利用其特定的PCR引物可将未知序列与已经基因在图谱上进行关联。 GSS是基因组DNA上随机单次读取的序列。一般在Cosmid/BAC/YAC 末端,外显子诱捕基因组序列以及Alu. SNP是基因组内普遍存在的自然的遗传变异现象。可能存在在非编码区,也可能在编码区。SNP被认为是一个特定物种中个体表型差异的源泉。 HTG, 从高通量测序中心中产生的未完成的DNA序列。entry 包含一个测序过程阶段关键字。一但测序完成,HTG序列会移到DDBJ/EMBL/GenBank相应的分类子集中。 WGS,Unassemble, unfinished sequences of WGS * * * Swiss-Prot注释包括功能、结构域、功能位点、跨膜区域、二硫键位置、翻译后修饰(如磷酸化与去磷酸化等)及其位点、突变体等。同时还有齐全的引文以及与包括核酸序列数据库、结构数据库PDB以及Prosite、PRINTS、SWISS-2Dpage等其他许多数据库的链接。 根据规定,一个特定物种的一个基因的所有蛋白质产物都被记录在Swiss-Prot数据库的一个记录里。 所有提交的蛋白质序列在转移到Swiss-Prot之前都先存储于TrEMBL。 It contains the translations of all coding sequences (CDS) present in the EMBL/GenBank/DDBJ and also protein sequences extracted from the literature or submitted to UniProtKB (derived from experiments). * 公共数据库存在的问题:1、冗余,一个生物学实体在不同的数据库中有不同的记录。2、对一个给定的序列记录来说,很难清楚它到底是由实验得到了还是计算机预测的。 * 这是序列数据库中最常使用的一种格式 An identifier (标识符,accession number.version number),Other more info

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档