生物信息学在基因芯片中的应用讲义.ppt

生物信息学在基因芯片中的应用讲义.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三节 基于芯片的序列分析 1、测定未知序列 早期基于芯片杂交的序列分析实验中,芯片上的探针是长度为k(一般为8)的所有寡核苷酸的组合。这是一种完备的探针集合,根据互补关系,通过各个探针的杂交结果确定DNA靶序列中存在的所有k长度片段,形成靶序列的k长度片段谱,然后根据这些片段重构靶序列。 2、直接检测目标序列 在同一块芯片上设计多组探针,每一组探针分别检测一条目标序列,探针的长度在20到30之间。一般要求同一组探针之间相互独立,尽可能不重叠或少重叠,以提高探针的敏感性和特异性。 3、DNA序列突变检测分析 有两种方法可以进行已知突变点的分析: 一种方法是对于目标序列上已知的突变点,以该点为中心,从目标序列选取一个片段,作为设计探针的参考序列。根据参考序列,分别设计四个高度特异的探针,这四个探针除中心位置外均相同并与参考序列互补 另一种方法是对于目标序列上已知的突变点,分别设计四组探针,其中每一组探针分别检测一种核苷酸替换。同一组中的各个探针长度相同,相互之间交叠,并且每个探针均覆盖对应的突变点。 4、基因型和多态性分析 在同一物种不同种群和个体之间,有着多种不同的基因型,这往往与个体的不同性状和多种遗传性疾病有着密切的关系。通过对大量具有不同性状的个体的基因型进行比较,就可以得出基因与性状的关系。 为了进行SNPs研究,发现目标序列上可能出现的变化,最直接的方法就是根据已知的目标序列设计一系列寡核苷酸探针,其中每一个探针用于检测目标序列特定位置上的核苷酸是否发生变化,探察位置位于探针的中心。这种方法又称等长等覆盖移位法 第二种方法为单核苷酸分析法。针对目标序列每个位置上所有可能出现的变化设计相应的探针。 第四节 基于芯片的基因功能分析 1、基因表达分析 基因表达是根据基因的DNA模板进行mRNA和蛋白质合成的过程,各种基因的表达存在差异,一种组织中基因表达水平的差异可达1万倍。功能基因研究的一种重要的方法就是采用高通量基因表达检测技术,全面分析基因的表达水平,了解基因的功能。 2、高密度基因表达芯片 3、基因表达图谱 基于芯片的表达监控实验产生大量的数据,在这些数据背后隐藏着丰富的基因相互作用、基因功能信息,需要通过细致的数据分析揭示这些信息,得到有益的结果 这种根据基因芯片获得的新的表达图谱有别于以前的物理图和功能图,它能够更为直接地揭示基因组中各基因相互关系。 4、寻找基因功能 DeRisi等应用酵母cDNA基因芯片研究在有丝分裂和孢子状态下基因转录和表达水平的差异。 Affymetrix公司制备的酵母基因表达型芯片,包括酵母基因组开放读码框中的260 000个25mer探针阵列。Wodicka 等采用这种基因芯片对不同生活状态下酵母细胞的基因表达进行了研究。 第五节 基因芯片检测结果的分析 1、荧光检测图像处理 基因芯片与样本杂交以后,用图像扫描仪器捕获芯片上的荧光图像。在计算机中,一幅图像由二维象素点所组成,通常用一个8-bit的整数存贮象素点的灰度值,取值范围为[0,255],其中0代表“黑”,255代表“白”。 一个理想的基因芯片图像具有以下几个性质: (1)芯片单元的形状和尺寸相同; (2)每个单元的中心位于象素点上; (3)无灰尘等引起的噪声信号; (4)最小和均匀的图像背景强度。 图象预处理 网格定位 背景滤除 荧光信号提取 归一化处理 网格定位结果 背景区域 背景滤除 荧光信号提取 2、检测结果分析 如果芯片检测的目的是测定样本序列,则需要根据芯片上每个探针的杂交结果判断样本中是否含有对应的互补序列片段,并利用生物信息学中的片段组装算法连接各个片段,形成更长的目标序列。 如果芯片检测的目的是进行序列变异分析,则要根据全匹配探针以及错配探针在基因芯片对应位置上的荧光信号强度,给出序列变化的位点,并指明发生什么变化。 如果芯片检测的目的是进行基因表达分析,则需要给出芯片上各个基因的表达图谱,定量描述基因的表达水平,进一步的分析还包括根据基因表达模式进行聚类,寻找基因之间的相关性,发现协同工作的基因 3、检测结果可靠性分析 可靠性分析可以从两个方面进行: 一是根据实验统计误差(如探针合成的错误率、全匹配探针与错配探针的误识率等),计算出基因芯片最终实验结果的可靠性。 二是对基因芯片与样本序列杂交过程进行分子动力学研究,建立芯片杂交过程的计算机仿真实验模型,以便在制作芯片之前分析所设计芯片的性能,预测芯片实验结果的可靠性。 4、数据分析 基因芯片数据分析包括实验数据管理、数据质量控制、数据处理等 进一步将基因芯片实验数据与公共数据库中的信息相关联,利用数据挖掘方法进行分析处理,揭示各种数据之间的关系,发现新的生物学知识。 第六节 基因芯片信息的管理和利

文档评论(0)

benzei244572 + 关注
实名认证
内容提供者

建筑工程师持证人

没啥好说的额

领域认证该用户于2024年10月16日上传了建筑工程师

1亿VIP精品文档

相关文档