一种改进吉布斯采样算法寻找模体的研究-论文.pdfVIP

一种改进吉布斯采样算法寻找模体的研究-论文.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种改进吉布斯采样算法寻找模体的研究-论文

一种改进吉布斯采样算法寻找模体的研究 1 匡斌,饶妮妮 ,韩凤君,袁祚勇 电子科技大学生命科学与技术学院,四川成都 (610054 ) 摘 要:当前有许多用于预测模体的算法,但没有一种算法能有效地应用在所有场合。依 据位置权重矩阵的模体模型,我们提出了一种改进的吉布斯采样算法来识别模体。该算法 有效地克服了吉布斯采样算法的局部收敛性,并且可以直观地控制预测模体的保守度。同 时我们引入了模体库的概念,并通过分析模体库数据,提高了模体预测的灵活性和准确率。 我们设计了仿真数据,并选择了已被生物实验验证过的模体数据,证实本算法的可行性和 有效性。与当前常用的基于吉布斯采样改进的算法比较,本算法有效地提高了模体预测的 准确性,灵活性和稳定性。 关键词:吉布斯采样,模体,位置权重矩阵, 模体寻找 1 引言 识别调控元件是理解基因转录调控机制和表达模式的关键。传统上是通过生物学实验 方法来测定调控元件的,这种办法费时又代价高昂[1-4] 。 随着计算机技术的飞速发展,科 学家们正尝试用计算机模拟来识别调控元件,以减少实验过程中的尝试性工作。 共调控的基因很可能在启动子区域共享模体。这样,转录水平基因调控元件的计算方 法识别问题就转化为从一组已知的共调控基因上游启动子区域中寻找共同的模体[1] 。通常, 从序列来预测调控元件是基于这样的假设:由于长期进化的结果,受相同调控机制作用的 基因(共调控基因)包含相对保守的启动子和调控元件,正是这种保守性使从序列来预测 调控元件成为可能[5] 。 目前已有大量寻找共同模体的方法,如 Bailey 和 Elkan 提出的MEME 算法[6](1995), [7] [8-9] [10] Consensus 算法 (1999)、Gibbs 采样算法 (1995) 、AlignACE 算法 (2000)、BioProspector 算法[2] [3] (2003)和BioOptimizer 算法 (2004)等,其中MEME 算法与Gibbs 采样算法是具有代 表性的方法[4] [11] 。Gibbs Sampling 算法虽然具有简单,计算速度快的优点,但却是局部优 化算法,不能保证结果的全局最优性。从目前寻找模体的国际商业流行算法来看,许多程 序都是基于吉布斯采样算法,然后作一定的算法改进使得它们更适合寻找模体,如 AlignACE[8], BioProspector[2] [3]等算法。 常用的吉布斯采样算法的改进策略有: [3] (1)控制背景噪声。主要采用高阶马尔可夫背景模型 ,来减少噪声干扰。 (2 )灵活的参数设置。模体查找算法结合生物试验的验证证明,大部分模体预测算法的准 确性都难以令人满意。为此,大部分模体预测算法都给出了灵活的参数设置来改善算法性 能,比如模体丰度参数[10] [2] [3] 、模体宽度参数 、两块模体之间的距离参数 和假计数百分比 参数等。这也是目前多种模体寻找算法和程序共存的主要原因之一。 [3] (3 )迭代过程中的方向控制, 以寻求最佳的解。采用记分函数 (scoring function) ,最大后 验记分[10] (MAP)等方法,力求找到最可能的预测模体或保守度最佳的预测模体。 现有吉布斯采样算法的改进策略主要存在以下缺陷: (1)对模体保守度参数控制不够灵活直观; (2 )在迭代控制中,可能会丧失实际生物模体保守度表现的灵活性,从而使模体预测不准 1 通信作者 -1-

文档评论(0)

jiupshaieuk12 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6212135231000003

1亿VIP精品文档

相关文档