一种从多表达谱数据挖掘基因共表达团的新方法*研究报告.pdfVIP

一种从多表达谱数据挖掘基因共表达团的新方法*研究报告.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种从多表达谱数据挖掘基因共表达团的新方法*研究报告

ResearchPapers 研究报告 生物化学与生物物理进展 ProgressinBiochemistryandBiophysics 2008,35(8):914~920 一种从多表达谱数据挖掘基因共表达团的新方法* 陈 兰1,3)** 王世敏1,3)** 陈润生1,2)*** 1) 2) 3) (中国科学院计算技术研究所,北京 100190; 中国科学院生物物理研究所,北京 100101; 中国科学院研究生院,北京 100049) 摘要 随着近年来高通量基因表达谱数据的涌现,集成多个不同实验条件的表达谱数据,并挖掘在多数据源都保守的基因共 表达团,成为预测基因功能或者调控关系的方法之一.但是,常用的方法通常仅简单地集成不同表达谱数据并推导保守基因 共表达团,这样可能会导致结果中出现并非真正在多数据源保守的共表达团.提出一种结合最小哈希与局部敏感哈希的新方 法,可以高效地寻找在多表达谱数据源中真正保守的基因共表达团.结果分析证明,相比过去的方法,现提出的方法可以获 得更加功能相关和调控相关的基因共表达团. 关键词 表达谱,共表达网络,最小哈希,局部敏感哈希 学科分类号 180.1410 随 着 测 量 mRNA 表 达 水 平 的微 阵 列 模式,但事实上它们的功能并不相关.此外,芯片 (microarray)技术的发展,近年来涌现了大量高通量 实验中的噪音也可能会导致对基因表达相关性估计 基因表达谱数据.这些数据使得我们可以获得大量 的误差.因此,简单地通过一个表达谱数据中基因 基因在同一个实验条件或者时间点的相对表达量, 的共表达模式来预测基因功能或者调控的关系,会 因此成为生物信息领域用于挖掘未知基因功能,或 引入不可预料的误差.考虑到有意义的生物模块倾 者推测基因间的转录调控关系的重要数据源.基于 向于在多个独立的实验条件下被激活,并且,由于 共享一个生物通路,或者属于相同蛋白质复合物的 数据噪音或者其他偶然因素导致的基因之间的高表 基因倾向于共调控的假设,许多研究都致力于从大 达相关,不太可能在多个实验条件下都保守.因 规模的基因表达谱数据中推导共表达的基因团,从 此,集成多个不同实验条件的表达谱数据,并挖掘 而预测基因的调控模式,或者未知基因的生物功能 在多数据源都保守的基因共表达团,可以降低对基 等.从表达谱数据中寻找基因共表达团的方法,可 因调控关系或者功能预测的误差. 以看做是从该表达谱数据代表的基因共表达网络中 集成多表达谱推导保守基因共表达团的方法 寻找比较稠密的子图.基因的共表达网络被定义 中,最常见的是首先集成不同表达谱得到一个 “综 [1,4] 为,图中的一个点代表表达谱数据中的一个基因, 合共表达网络”,然后从中挖掘基因共表达团 . 如果两个基因之间共表达,则在图中对应的两点之 在这个 “综合共表达网络”的图中,每一个点代表 间连接一条边.判断两个基因是否共表达的方法有 一个基因.如果两个基因在多个表达谱数据中都有 很多种,最常用的方法是首先计算基因的表达相关 较高的表达相关性,也就是说这两个基因在多数据 性,再判断该表达相关性的值是否大于一个事先设 源中保守共表达,则在图中对应的两点之间连接一 定的阈值,或者用统计方法计算该表达相关性是否 条边.基于该网络寻找的基因共表达团,比从单数 [1,2] 显著的高 . [3] 然而,在一些研究中指出 ,相似的基因表达 模式并不一定意味着基因的功能相关,反之亦然. *国家自然科学基金资助项目30570393. **共同第一作者. 例如,即使在相

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档