- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
科技
science topics 專題
基因芯片数据处理流程
与分析介绍
当人类基因体定序计划的重要里程碑完成之 要获得有意义的分析结果,恐怕不能如泼墨画
后,生命科学正式迈入了一个后基因体时代,基因 般洒脱随兴所致。从 raw data 取得后,需要一连贯
芯片 (microarray) 的出现让研究人员得以宏观的 的分析流程 (图一),经过许多统计方法,才能条清
视野来探讨分子机转。不过分析是相当复杂的学 理明的将 raw data 整理出一初步的分析数据,当处
问,正因为基因芯片成千上万的信息使得分析数据 理到取得实验组除以对照组的对数值后 (log2
量庞大,更需要应用到生物统计与生物信息相关软 ratio) ,大约完成初步的统计工作,可进展到下一步
件的协助。要取得一完整的数据结果,除了前端的 的进阶分析阶段。
实验设计与操作的无暇外,如何以精确的分析取得
可信数据,运筹帷幄于方寸之间,更是画龙点睛的
关键。
基因芯片的应用
基因芯片可以同时针对生物体内数以千计的
基因进行表现量分析,对于科学研究者而言,不论
是细胞的生命周期、生化调控路径、蛋白质交互作
用关系等等研究,或是药物研发中对于药物作用目
标基因的筛选,到临床的疾病诊断预测,都为基因
芯片可以发挥功用的范畴。
基因表现图谱抓取了时间点当下所有的动态
基因表现情形,将所有的探针所代表的基因与荧光
强度转换成基本数据 (raw data) 后,仿如尚未解密
前的达文西密码,隐藏的奥秘由丝丝的线索串联绵 图一、整体分析流程。基本上 raw data 取得后,将经过从最上
延,有待专家抽丝剥茧,如剥洋葱般从外而内层层 到下的一连串分析流程。(1) Rosetta 软件会透过统计的 model,
解析出数千数万数据下的隐晦含义。 给予不同的权重来评估数据的可信度,譬如一些实验操作的误
差或是样品制备与处理上的瑕疵等,可已经过 Rosetta error
model 的修正而提高数据的可信值;(2) 移除重复出现的探针数
整体分析的概略流程 据;(3) 移除 flagged 数据,并以中位数对荧光强度的数据进行
1 華聯快訊 2011.09
科技
專題
标准化 (Normalized) 的校正;(4) Pearson correlation
coefficient (得到 R 值) 目的在比较技术性重复下的相似性,R
值越高表示两芯片结果越近似。当 R 值超过 0.975,我们才将
此次的实验结果视为可信,才继续后面的分析流程;(5) 将技术
性重复芯片间的数据进行平均,取得一平均之后的数据;(6) 将
实验组除以对照组的荧光表现强度差异数据,取对数值 (log2
ratio) 进行计算。
找寻差异表现基因
实验组与对照组比较后的数据,最重要的就是 图二、主成分分析 control 组与 treatment 组间的芯片结果。
要找出显著的差异表现基因,因为这些正是条件改
文档评论(0)