Affymetri芯片质量评估.pdf

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Affymetrix 芯片质量评估 在拿到(数据库下载或者自己实验得到)的芯片,最好 先对芯片的质量做出评估,从而将有问题的芯片剔除。在 Robert Gentleman 的“ Bioinformatics and Computational Biology Solutions Using R and Bioconductor ”书的第三章提到“ Before any useis made of more complex methods, an initial examination of the data can often show evidence of possible quality problems. ”。以下关于 Affymetrix 芯片质控 的图和脚本,也引用上述参考书。首先是一些基础知识: 1 Affymetrix 芯片的数据格式主要有 .dat 和 .cel 两种。DAT 文件 是原始芯片图像的扫描文件, 需要用 affy 公司自己的软件打 开。 CEL 文件是 DAT 文件去除背景噪音后的文件,包括了 每个探针的原始密度数值( raw intensity value )。其中,我们最关注 CEL 文件,这也是我们后续载入 Bioconductor 中的原始数据类型。 后续需要对 CEL 文件进行 “质量评估”、“归一化”、“注释”等一系列预处理。 2 affy 芯片的数据单元。下图是一个“探针集( probeset)”, 包括了 11-20 个长度位 22nt 的 “探针 (probe)”,图中每个亮 格代表一个探针。每个探针分为 PM (Perfect Match )和 MM (Mis-Match )两种,区别就是 MM 探针故意 将一个碱基设计错。这样做的目的是为了控制芯片的非特异 性杂交,从而获得更准确的信号值。 芯片质量控制: 1. 对于“探针数据( probe-data level )”的三 种图,使用 affy package boxplot( ):未处理的原始探针密度(以 2 为底取对数)的盒箱图。 评价标准:代表各个芯片的“盒箱”是否在同一个水平上。 如果出现像 f 那样的“断层” ,也不能推断 f 芯片出现质量问 题,因为可能通过“归一化( normalization )”使其在同一个 水平上。 hist( ) :计算未处理的原始探针密度 (以2 为底取对 数)的直方图,实际画出的是平滑的密度曲线。 评价标准:查看所有芯片中是否有异常过高的密度值。下图 中可能出现如 a 芯片(红色)的“双峰”曲线,表明其密度 曲线服从 bimodal distribution( 双峰分布 ) (什么是双峰分布)。 这表明 a 芯片可能有“人为空白( spatial artifact )”的质量缺 陷。 MAplot( ) :查看每张芯片的 MA-plot 评价标准:通过红色的“ loess smoother curve ”与 y=0 的关系衡量芯片的质量。 如果红色曲线在蓝色 直线上下摆动的很厉害,同时数值过

您可能关注的文档

文档评论(0)

tianya189 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体阳新县融易互联网技术工作室
IP属地上海
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档