基因晶片数据处理流程与分析介绍.PDF

基因晶片数据处理流程与分析介绍.PDF

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基因晶片数据处理流程与分析介绍

科技 science topics 專題 基因晶片數據處理流程 與分析介紹 當人類基因體定序計劃的重要里程碑完成之 要獲得有意義的分析結果,恐怕不能如潑墨畫 後,生命科學正式邁入了一個後基因體時代,基因 般灑脫隨興所致。從raw data 取得後,需要一連貫 晶片 (microarray) 的出現讓研究人員得以宏觀的 的分析流程 (圖一) ,經過許多統計方法,才能條清 視野來探討分子機轉。不過分析是相當複雜的學 理明的將 raw data 整理出一初步的分析資料,當處 問,正因為基因晶片成千上萬的資訊使得分析資料 理到取得實驗組除以對照組的對數值後 (log2 量龐大,更需要應用到生物統計與生物資訊相關軟 ratio) ,大約完成初步的統計工作,可進展到下一步 體的協助。要取得一完整的數據結果,除了前端的 的進階分析階段。 實驗設計與操作的無暇外,如何以精確的分析取得 可信數據 ,運籌帷幄於方寸之間,更是畫龍點睛的 關鍵。 基因晶片的應用 基因晶片可以同時針對生物體內數以千計的 基因進行表現量分析,對於科學研究者而言,不論 是細胞的生命週期、生化調控路徑、蛋白質交互作 用關係等等研究,或是藥物研發中對於藥物作用目 標基因的篩選,到臨床的疾病診斷預測,都為基因 晶片可以發揮功用的範疇。 基因表現圖譜抓取了時間點當下所有的動態 基因表現情形,將所有的探針所代表的基因與螢光 強度轉換成基本數據 (raw data) 後,仿如尚未解密 前的達文西密碼,隱藏的奧秘由絲絲的線索串聯綿 圖一、整體分析流程。基本上 raw data 取得後,將經過從最上 延,有待專 家抽絲剝繭 ,如剝洋蔥般從外而內層層 到下的一連串分析流程。(1) Rosetta 軟體會透過統計的 解析出數千數萬數據下的隱晦含義。 model ,給予不同的權重來評估數據的可信度,譬如一些實驗操 作的誤差或是樣品製備與處理上的瑕疵等,可已經過 Rosetta error model 的修正而提高數據的可信值;(2) 移除重覆出現的 整體分析的概略流程 探針數據取平均值;(3) 移除 flagged 資料,並以中位數對螢光 1 華聯快訊 2011.09 科技 專題 強度的數據進行標準化 (Normalized) 的校正;(4) Pearson correlation coefficient (得到 R 值) 目的在比較技術性重覆下 的相似性 ,R 值越高表示兩晶片結果越近似 。當 R 值超過 0.975 ,我們才將此次的實驗結果視為可信,才繼續後面的分析 流程;(5) 將技術性重覆晶片間的數據進行平均 ,取得一平均之 後的數據;(6) 將實驗組除以對照組的螢光表現強度差異數據, 取對數值 (log2 ratio) 進行計算 。 找尋差異表現基因 實驗組與對照組比較後的數據,最重要的就是 圖二、主成分分析 control 組與 treatment 組間的晶片結果。 要找

您可能关注的文档

文档评论(0)

shaofang00 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档