特异基因挖掘及顺式元件分析.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
组织特异性表达基因挖掘及顺 式元件分析 主讲人:宋伟 2012.05.27 分析流程图 一、组织特异表达基因挖掘 1. 基因芯片数据下载 数据的预处理 计算方法 2. 3. 4. 组织特异基因筛选 基因功能分析 5. 二、顺式元件分析 1. 基因启动子序列的获得 阴性参照的选取 特异性顺式元件的预测 2. 3. 4. 元件功能分析 基因芯片数据下载 ? ? ? 实验分析所使用的水稻基因表达数据均来 自 NCBI GEO 数据库中的水稻 Affymatrix 生物 芯片数据 选取每个实验系列中有具体组织的实验, 如根、叶、胚等等,并且还要筛选那些空 白组、对照组和野生组等无处理的组织基 因芯片。 最终选取并下载了 274 张基因芯片 芯片数据预处理 ? ? 均一化: RMAExpress 工具。两种文件: .cel 和 .cdf 。水稻的 .CDF 文件需要在 EMBL-EBL 的 ArrayExpress 数据库中下载(下载地址为: http://www.ebi.ac.uk/arrayexpress/files/E-GEOD-16793 ) 探针与基因序列对应:水稻 Affymatrix 基因 组芯片包含 57381 个探针组,每组探针包括 11 个探针序列,我们要求至少其中 7 个探针 能与基因序列完全匹配。而后我们进一步 排除那些一个探针组对应多个基因的映射, 以及多个探针组对应一个基因的映射。 57381 25737 统计参数 SPC ? ? ? 将基因在不同组织中的表达信号看作一个多维空 间内的向量 X p : X p = (x 1 , x 2 , x 3 , ... , x i , ... , x n ) 理想状态下,假设基因 x 只在组织 i 中特异表达,则 其对应的向量 X i 可表示为: X i =(0, 0, 0, ... , x i , ... , 0) 基因 x 的组织特异性由两个向量夹角的余弦值来决 定 , 称其为 SPC ( Specificity Cosine ) 基因组织特异性计算 两种情况下不同计算公式: 1. 基因只在一种组织中特异表达: 2. 基因在两种相近性组织中特异表达: 判断组织特异性基因的条件 1. 计算中基因在组织中 SPC=0.9; 2. 基因在组织中的平均表达信号强度 100; ? 结果: 胚乳特异表达基因: 127 个; 根特异表达基因: 394 个; 挖掘结果:水稻胚乳( 127 个) 基因功能分析 1. 根据 Plant Biology 网站的基因功能注释 一些转录因子基因 2.GO 分类: AgriGO 工具 Molecular function , F Biology process , P Cellular component , C 基因启动子序列 ? 水稻基因启动子序列(位置设定在非 编码区 -1000bp~0bp ,长度为 1000bp )。 RAP 数据库( http://rapdb.dna.affrc.go.jp/tools/dump/ ) ? 下载,保存为 .fasta 格式 LOC_Os06g31070.1 1000 bp upstream sequence AAATAAATACAGGAAATTGCTAAGTTTGTAATCTAAAATATAATATTGTCATAATATAATAATTCTAAAATTCAAATT AATAAATACCAAGTTGATGTTTTATTTAAAATATATAGTATGTGCCGCACAGCTTGATGCTTAGTCTAGATCTTTTA ACCGTGCTACGCTGGGTTAATTAGCGATGGTGCAGGTCACGTACCCAAATTTCTTCACTGTTGGATCAACTAGAG TAGTTAAACGAGGGCATGTGATGAAGGCTAGCTATTTGAAATTTTCCAATTATCCCTGCATAAGTCAGGCTACAAT AGCACCTGGACTACATGCAGGGATTACAAAATAGGTGGTAACCACATTtaccgcgttaaccctatcaaattcaaataaattttaaaagtaattt gatttttttaataaattttgtatggtttctcaagctttattttggttaccgtgcttactgcCGGAGGCAATGGGAAACCCTCACTAGAAGTTGCACCTGTT CTTGTCTGTGCACCATATCATGTTGAATCATGTGCGTTGTGTCCTTTCGGAAGAACCGATTTACTACATGACTCAT CAATTCCACTTTACGTATCAAAAGGTTTGTTATGGGGGCAATGCTTTTGTGAAATTAAATTTTTATTTTGCG

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档