以资料探勘方式探究启动子的共通特色Characterizationofthe.pptVIP

以资料探勘方式探究启动子的共通特色Characterizationofthe.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
以資料探勘方式探究啟動子的共通特色 Characterization of the hallmarks of a promoter by data-mining techniques (NSC89-2316-B-029-001) 羅能文 博士 東海大學畜產學研究所 細胞與分子生物學研究室 Overview 啟動區或是啟動子 (promoter) 是一個基因轉訊開端的訊息提供者,通常位於轉訊起始 (transcriptional initiation) 的上游。 對一些蛋白質基因而言,pol-II在合成訊息RNA之初,會認識轉訊起始點上游約25個bps的共通序列-TATAAA或稱TATA BOX,以及轉訊起始點上游約75個bps的共通序列CAAT BOX。 人類基因體計劃(human genome project)DNA解序完成後,如何由基因資料庫裡辨識出功能基因(function gene)的完整序列,已成為一項重要工作。 解決途徑 EST database 尋找轉譯的起點與終點,決定ORF 尋找轉訊的起始與啟動區、 決定exon/intron boundries 、轉訊的終點 計畫完成工作項目 由NCBI 資料庫查詢基因啟動區序列,摘取並儲存DNA序列, 重新以電腦軟體過濾、處理建檔 建立國際網頁方式,對外公開,提供各類相關資訊 以統計與資料探勘方式,搜尋潛在具有turn on基因表現的啟動區序列或轉訊因子 生物驗證─ 利用in vitro mutagenesis方式進行reporter analysis Predicting Pol II Promoter Sequences (Prestridge, 1995) Predicting Pol II Promoter Sequences Using Transcription Factor Binding Sites (Prestridge, 1995) Promoter 2.0: for the Recognition of Pol II Promoter Sequences (Knudsen, 1999) Promoter 2.0: for the Recognition of Pol II Promoter Sequences (Knudsen, 1999) Neural network 1: TATA box weights set to give maximum response for sequence TATAAA Neural network 2: cap site weights set to TCA Neural network 3: CCAAT box weights set to CCAATC Neural network 4: GC box weights set to GGGCGG PromoterInspector: A Novel Context Analysis Approach (Scherf et al., 2000) PromoterInspector focuses on genetic context rather than their exact location Context feature: based on an approach using oligonucleotides with one variable mismatch. IUPAC group is uniquely defined by a set of oligonucleotides and a number of undefined basepairs (wildcards, “N”). Example : two wildcards and the oligonucleotide set E.g., (AGC, GCA) ? (AGCGCA, AGCNGCA, AGCNNGCA) PromoterInspector: A Novel Context Analysis Approach (Scherf et al., 2000) (cont.) A classifier is defined by two disjunct sets of IUPAC groups: Promoter-related IUPAC groups ? “promoter” Non-promoter-related IUPAC groups ? “non-promoter” Classification is based on IUPAC group matches. AGCTG: (AGCT, AGNCT, AGNNCT),

您可能关注的文档

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档