微阵列第8次课.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八章 基因芯片探针校正 黄仲曦 基础医学院肿瘤研究所 为什么要校正 Affymetrix公司HG-U133及以前的型号设计于2001年以前;当时人类基因组测序只完成25%。这些芯片的探针许多现在被发现是非特异的,必须放弃。 尽管Affymetrix公司对探针集注释信息每季度更新一次,仍无法改变许多探针集中的某些探针已经指向其它的基因甚至多个基因。 基因芯片存在多个探针集指向同一个基因的问题。还没有标准的办法来处理这类问题。最直接的办法是将它们融合在一起,实现一个基因(转录本)对应一个探针集。 如何校正-产生CDF文件 所有探针与最新的Unigene序列和基因组序列进行比对。 产生Unigene CDF文件(Affymetrix原始设计) 探针必须同时与cDNA/EST和基因组序列完全匹配; 探针必须只与唯一的Unigene和唯一的基因组序列匹配; 指向同一基因的所有探针必须按顺序排列在基因组区域的同一方向上; 每个探针集必须至少包含3个探针而且定位在不同的位置。 产生参考序列、Entrez 基因和外显子、ENSEMBL基因、转录本和外显子以及 VEGA基因、转录本和外显子的CDF文件 一个探针必须只与唯一的基因组序列匹配; 匹配到同一靶序列而且方向相同的探针组成一个新的探针集; 每个探针集必须至少包含3个探针而且定位在不同的位置。 探针校正的缺陷 探针校正以后,探针集所含的探针从3个到几十个不等,使得不同探针集的误差变化很大。 对于Unigene CDF文件来说,会丢掉一些好的探针。它们由于嵌合克隆或基因同源而存在于多个基因。 对于ENSEMBL外显子CDF文件来说,在外显子定义上仍然有许多重叠和冗余。 对于ENSEMBL转录本CDF文件来说,仍然有许多已知的转录本没有被包含。 探针校正所产生的影响 以Hs_U133A的CDF文件校正为Hs_U133A_UG167为例: 大约有4000个基因的多个探针集被融合为单个探针集。因此,基因表达的测量误差也随之降低。 如果一个探针集只剩下3-5个探针的话,测量误差将增大2-3倍。大约有900个基因受此影响,并且表达值与原来相比变化25%以上。 总的来说,在一个包含14个脑样品的测量实验中,大约20%-30%基因的表达值在校正前后发生改变。 怎样使用校正后的CDF文件 RMAExpress、MAS5和dChip可以直接使用,但是dChip要将名字改回Affymetrix原来的命名。 BioConductor使用(略) 用Ensembl数据库获取基因注释: 参考文献 基因芯片标准化和表达值计算 RMA分析过程 PM探针信号的背景校正(MM探针) PM探针信号的标准化(分位数) PM探针信号的求对数(以2为底) 基因表达值计算 思考题 基因芯片的探针为什么需要校正? 表达芯片总结 芯片设计原理 表达值计算与方差估计 标准化与基因筛选 聚类分析 基因功能的数据库挖掘 文献挖掘 探针校正 * 《微阵列设计与分析》 /Brainarray/Database/CustomCDF/CDF_download.asp#v12 MicroRNA基因家族 MIRBASEF MicroRNA基因 MIRBASEG 瓦片芯片基因 TAIRG 瓦片芯片转录本 TAIRT 参考序列 REFSEQ VEGA转录本 VEGAT Ensembl 转录本 ENST VEGA外显子 VEGAE Ensembl 外显子 ENSE VEGA基因 VEGAG Ensembl 基因 ENSG Unigene UG Entrez 基因 ENTREZG 注释 Custom CDF /group/customcdf/ Dai M, Wang P, Boyd AD, Kostov G, Athey B, Jones EG, Bunney WE, Myers RM, Speed TP, Akil H, Watson SJ, Meng F. Evolving Gene/Transcript Definitions Significantly Alter the Interpretation of GeneChip Data. Nucleic Acid Research. 2005, 33 (20), e175 / Robust Multichip Average μ基因表达值,α探针增强系数,ε随机误差 * * *

文档评论(0)

gm8099 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档