- 1、本文档共39页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[理学]生物信息学Chapter06
6.1 引言 基因组分析的主要任务是确定基因在染色体上的位置,提供遗传信息,并探讨基因与基因之间以及基因与经典遗传学、医学诸多方面之间的联系 基因组(genome)是指一个生物体、细胞器或病毒的整套基因 基因组学(genomics)是以基因组分析为手段,研究基因组的结构组成、时序表达模式和功能,并提供有关生物物种及其细胞功能的进化信息。 6.1 引言 基因组信息学是指有关基因组信息的存储、获取、处理、分配、分析和注释等方面的研究 6.1 引言 基因组分析的工作难度大 6.2 基因组分析的原理 基因组的结构组成与稳定性 基因组作图 基因组计划 6.2.1 基因组的结构组成与稳定性 6.2.1.1 原核生物与真核生物基因组的差异 人类和若干模式生物的基因组大小 6.2.1.2 基因组中基因的相对位置 6.2.1.3 基因组结构和染色体的稳定性 6.2.2 基因组作图 遗传连锁图 物理图 表达图 6.2.2.1 遗传连锁图 在植物中,已建立的遗传图谱有大麦(Ramsay, et al, 2000)、小麦(Marion, et al, 1998) 、燕麦(Yu, et al, 2000)、水稻(Harushimay, et al, 1998)、玉米(Wilson, et al, 1999) 、大豆(Matthews, et al, 2001) 、西红柿和土豆(Tanksley et al 1992)等 在动物中,已建立的遗传图谱有小鼠(Blake, et al, 2000)和老鼠(Steen, et al, 1999),还有猪、马、牛、羊、鸡等家畜和家禽,甚至还有家蚕(Tan, et al, 2001) 最近的人类高密度遗传图谱是Kong等(2002)建立的 林木遗传图谱构建研究的现状 林木遗传连锁图谱构建最早从火炬松开始 ,使用的是同功酶标记; 滞后于农作物约十多年 ,但进展非常迅速 ,近10年 ,已有30多个树种构建了遗传连锁图谱; 利用RAPD标记技术构图的居多 ,占 90 %左右; 图谱具有标记数量最多的是毛果杨×美洲黑杨,标记达343个;最少的是短叶红豆杉,仅有 41个; 图谱总图距最长的是欧洲云杉达3584cM;最短的是短叶红豆杉达305.8cM; 特点:图谱密度偏低,大都为显性标记,作图群体偏小。 遗传图谱构建的统计分析步骤 两点连锁分析 连锁群的划分 基因位点的排序 多位点连锁分析 杉木遗传图谱的构建 BC1群体 F2群体 6.2.3 基因组计划 STS基因组图 信息冗余 人类基因绘图 6.2.3.1 STS基因组图 6.3 功能基因组学 功能基因与功能基因组学 非确定读码(URF) 直系同源体蔟(COG) 6.3.1 功能基因与功能基因组学 功能基因 6.3.2 非确定读码(URF) 非确定读码(unidentified reading frame)是指DNA序列中识别出的一个可读框,但其生物学功能尚不明确 目前基因组计划中发现了30%或40%的非确定读码,它们必定编码了新的蛋白质 通过结构来预测功能存在着一定的局限性,这是由于有限的样本大小(即已知结构的数量)限制了预测的精确性 6.3.2 非确定读码(URF) 可通过基因组的“行为”来研究新基因的关系 6.3.3 直系同源体簇(COG) 直系同源基因(orthologous gene)是指在不同物种之间同源相似的基因 并系同源基因(paralogous gene)是指一个物种内的同源基因 一个生物物种的基因组中,两个基因或可读框在各自全长的60%以上的范围内,同一性不少于30%时,称为同源体 直系同源体簇(cluster of orthologous groups) 6.4 比较基因组学 基本原理 主要方法 功能网络 6.4.1 基本原理 5种模式生物:大肠杆菌(E. coli)、酿酒酵母(S. cerevisiae)、秀丽新小杆线虫(C. elegans)、黑腹果蝇(D. melanogaster)和小鼠(M. musculus) 可以从模式生物中寻找人类可能具有的新基因 如,先确定“胖鼠”基因在小鼠基因组中的位置,然后根据小数基因组与人类基因组的对应关系,可获得人类的“肥胖”基因 6.4.2 主要方法 系统发育概形法 Rosetta Stone法 基因邻居法 方法比较 Rosetta Stone法 一些相互间存在作用的蛋白,其同源物在另一种生物上融合成一个单一的蛋白,这个蛋白序列称为“融合蛋白序列”或Rosetta Stone 序列 一个生物体中独立的蛋白A和B在其他物种中可能是作为一个融合蛋白表达的,此时结构域A和B基本上是关联的 由于A和B有不相关的序列,这种功能
文档评论(0)