文本挖掘和在系统生物学中的潜在应用.pptVIP

  • 2
  • 0
  • 约2.12千字
  • 约 21页
  • 2018-12-31 发布于湖北
  • 举报

文本挖掘和在系统生物学中的潜在应用.ppt

(二)消除歧义的方法 1.术语消歧义方法,用监督机器学习的方法来消除文本中基因,蛋白质,和RNA的歧义。 2.手工规则与各种监督和非监督技术相结合。 3.用基于生命科学的标识符的数据分解软件。 适合生物学全面解析的系统:MEDIE 文本挖掘和在系统生物学中的潜在应用 一、引言 (一)文本挖掘技术出现的背景 1.文本中记录了大量的生物医学知识,人们对于一些能提取、处理、综合和利用这些知识的技术产生了兴趣。如MEDLINE数据库。 2.开架阅览期刊发行的普遍,全文更有可用性。大量文本资源的可用性为科学家提供了寻找相互关系和关联性的机会。如蛋白质之间的相互作用,基因和疾病之间的相互关系。 3.传统的信息检索框架(基于关键字的方法),不能处理这些过载的信息。 科学家开始把注意力集中到文本挖掘技术上。 (二)现状:在过去的五年中,在生物医学的文献中以数据挖掘为主题的研究论文和综述出现了一个高潮。 (三)文本挖掘的功能: 1.文本挖掘的主要目标是检索文本中隐藏是信息并且以简明的形式把蒸馏的知识呈现给用户。 2.文本挖掘可以找到文本的相关社团、模式和聚类。 (四)系统生物学的特点 1.系统生物学涉及到计算模型,高通量、高内涵实验和技术发展之间的迭代的相互作用。 2.高度跨学科性,它涉及到生物学的很宽领域和精密科学的知识整理,并且这对于文本挖掘技术的开发是特别有利的领域。 二、用文本挖掘生

文档评论(0)

1亿VIP精品文档

相关文档