- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
筱哥哥,作业-中国基因组生物信息学
中国基因组生物信息学
基因组生物信息学是随着大规模基因组测序而兴起的一门交叉学科, 其研究对象是基因组数据. 因此, 对基因组数据的各方面的深入了解, 有助于把握基因组生物信息学的来龙去脉. 今天, 由新一代测序技术所带来的对数据处理、算法设计和功能信息挖掘等技术和研究方面的挑战, 应该及时得到充分的重视.。
基因组生物信息学是随着大规模基因组测序而兴起的一门交叉学科. 其主要研究内容是利用计算机系统收集、储存、分析和比较各种基因组信息, 包括开发和建立一系列相关的数据库、算法和软件包. 生物信息学一方面运用计算机和数理学科的知识和技术服务于生物学数据研究, 另一方面为传统的数理研究开辟了新的研究方向, 这一“桥梁”作用使得生物信息学像其他交叉学科一样, “左右逢源”, 在近10年中发展特别迅速.
基因组生物信息学的研究对象是基因组数据. 对基因组数据各方面的深入了解, 有助于把握基因组生物信息学的来龙去脉.
DNA测序工作起始于20世纪70年代中期。 在1990年正式启动人类基因组计划之后, DNA测序工作由量变到质变, 出现了一系列革命性的发展. 当该计划于2003年全面完成后, 生物学家并没有局限于人类的基因组计划, 而是利用人类基因组计划所解决的一些诸如物理图谱构建、高通量序列测定、序列拼接等关键技术, 运用于其他生物的基因组序列的研究计划. 至今, 已经有较完整的全基因组序列数据的物种包括39种类病毒、2,115种病毒 、58种古菌、1,269种细菌(包括51种蓝藻)、69种真菌、29种原生生物、10种植物和78种动物(图1). 在这3720个物种中, 病毒由于基因组很小, 积累了大量物种的基因组数据. 原核生物因为其基因组紧凑测序量相对较小, 已经测序的物种占非病毒物种数的8成. 对原生生物和真菌的基因组测序工作由于基因组比较庞大, 除了酵母以外主要集中于和人类关系较密切的物种, 如治病物种和工业用菌等. 植物由于其多倍体化比较普遍, 对较大较复杂的植物基因组单纯用全基因组鸟枪法测序难以胜任, 必须构建物理图谱[2], 使得项目进度相对比较缓慢, 基因组测序工作还停留在基因组较小的少数模式物种阶段. 动物(特别是后口动物, metazoa)由于进化、生物学和与人类关系密切等等方面的因素, 虽然不少物种的基因组并不小, 但是研究进展十分可观. 脊椎动物如人(Homo sapiens)、小鼠(Mus musculus)、马(Equus caballus)、牛(Bos taurus)、家狗(Canis lupus familiaris)等; 昆虫如果蝇(Drosophila melanogaster)、家蚕(Bombyx mori)和面粉甲虫(Tribolium castaneum)等, 基因组数据已深入到目(Order)的水平, 为比较基因组和功能基因组研究提供了很好的系列数据.
随着基因组测序技术的发展及众多基因组测序计划的提出和实施, 很多动、植物己经完成了基因组测序, 将来会有更多的基因组序列被测定. 因此如何分析这些基因组序列, 挖掘序列数据所蕴含的功能信息, 已经成为基因组学研究的重要内容. 基因组计划的发展为研究者提供了极其丰富的资源. 但是, 迄今为止, 仍有许多基因和DNA元件的功能未被发现. 由此在2003年产生了ENCODE项目, 并在2007年得以扩大研究.
(1) 用比较基因组方法进行基因和DNA元件功能注释. 比较基因组学研究跨生物学分类界限的基因组结构和功能的相似性和差异, 已经成为了挖掘潜在功能信息的强有力工具. 之前的比较基因组学较多解决的是少数物种间比较的问题. 现在特别是在微生物基因组研究领域, 常常出现同一个种的不同特色菌株都有全基因组序列数据. 这样的局面使得比较基因组学必须能同时比较多个物种, 运用一些进化方面的算法, 并运用一些网络生物信息学的成果进行网络化比对进行功能信息挖掘已成为必然. 在真核模式生物方面, 这样的研究趋势也已经非常明显. 2007年美国、丹麦等国研究人员利用12种果蝇的基因组数据, 完成首次大规模全基因组比对, 确定出了数千个新的基因和其他功能元件. 从中揭示了新的基因, 新的结构和调控子. 围绕着线虫也有至少5个基因组整体比较的计划, 被称为Roundworm基因组计划。
经过研究发现, 多个基因组共同注释比单物种基因组单独作注释的准确性和覆盖度要好得多. 运用Ortholog和基因家族Profile构建等方法, 可以跨过物种界限将基因横向联系起来, 相互提示基因功能信息, 如基于KEGG Ortholog(KO)的KAAS服务器 和基于SEED数据库的RAST服务器, 以及最近发表的IMG数据库。
文档评论(0)