- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于多数据域描述的转录因子结合位点识别
陈鸣1 薛慧君2 熊赟1 朱扬勇1
1(复旦大学计算机科学技术学院 上海 200433)
2(内蒙古电子信息职业技术学院计算机科学系 呼和浩特 010011)
转录因子结合位点的识别对于理解转录调控机制起着重要作用,也是后基因组时代面临的巨大挑战之一。本文提出了一个基于多任务学习的转录因子位点的识别方法。首先建立了一个基于多任务学习理论的多数据域描述模型,然后结合核方法设计转录因子结合位点多分类识别算法。最后对取自于TRANSFAC数据库的真实数据进行交叉验证测试。实验结果表明该方法能充分地利用稀缺的训练样本,有效地捕获不同类别间的联系,从而获得了较高的预测准确率。
多任务学习 转录因子结合位点 多数据域描述 核方法
Transcription Factor Binding Sites Recognition by Multiple Data Domain Description
Chen Ming1 Xue Huijun2 Xiong Yun1 Zhu Yangyong1
1(School of Computer Science, Fudan University, Shanghai 200433,China)
2(Department of Computer Science, Inner Mongolia Electronic Information Vocational Technical College, Hohhot 010011,China)
This paper presents a multi-task learning approach to the problem of Transcription Factor Binding Sites (TFBS) recognition. Firstly, a new multiple data domain description model was established; it was theoretically founded on the new kernel-based multi-task learning formulation of learning multiple tasks simultaneously in order to capture shared structures among tasks. Then, the model was naturally cast to the case of TFBS recognition with kernel methods. Finally, real data set was retrieved from TRANSFAC database to validate the effectiveness of the proposed method. The experimental result indicated that our multi-task learning approach can significantly improve the prediction accuracy by virtue of using training examples from multiple classes as a whole and meanwhile capturing their inter-class relatedness.
Multi-task Learning Transcription Factor Binding Sites Multiple Data Domain Description Kernel Methods
引 言
在分子生物学领域,理解转录调控机制是后基因组时代重大挑战之一。达到这一目标的重要步骤是转录因子结合位点(Transcription Factor Binding Sites: TFBS)的识别。转录因子结合位点是基因上游启动子区域长度为5~15bp的短序列片段,被转录因子结合以调控下游基因。通过生物学试验检测TFBS的方法由于开销大、耗时长等缺点,不适合处理海量数据。因此,越来越多的计算识别方法被提出用于初选待测位点。通常一个转录因子结合位点可以被一个或多个转录因子结合,而相关研究表明这种结合具有较高的特异性。因此,在计算分子生物学领域,TFBS的识别问题可视为一个多类别模式分类问题,即给定一个未知样本,判定它可能被那一类或哪几类转录因子结合。
目前,基于核方法和正则化理论的机器学习分类算法是最常用的方法之一,也是统计学习理论 (Statistical learning theory: SLT)
您可能关注的文档
- 大邑一次联考(理综).doc
- VB学生信息管理系统设计与开发论文.doc
- 届江苏高考数学二轮复习:专题不等式与推理证明.doc
- 继电保护复习资料(5).doc
- 北京西城区高级抽样测试期末.doc
- 学下学期课表艺术、动画、学前专业.doc
- 燃料电池并网控制策略研究0.doc
- 秸秆煤炭成型机方案论证报告.doc
- 机械制造技术课程设计说明书99.doc
- 产品包装卧式取袋机设计.doc
- 2025年一级建造师考试《水利水电工程管理与实务》冲刺必刷卷.docx
- 2025年一级建造师考试《水利水电工程管理与实务》逆袭破题卷1.docx
- 2025年一级建造师考试《市政工程管理与实务》冲刺必刷卷 .docx
- 2025年一级造价工程师考试《建设工程计价》预习卷.docx
- 2025年一级造价工程师考试《建设工程造价管理》预习卷.docx
- 2025年一级造价工程师考试《建设工程造价案例分析(安装专业)》预习卷.docx
- 2025年一级造价工程师考试《建设工程造价案例分析(土建专业)》预习卷.docx
- 2025年中级会计考试《会计实务》冲刺提分卷.docx
- 2025年中级会计考试《财务管理》冲刺提分卷.docx
- 2025年中级会计考试《财务管理》全真模拟卷.docx
文档评论(0)