生物医学相关的本体研究现状的探究.pdfVIP

生物医学相关的本体研究现状的探究.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
41.生物医学相关的本体研究现状的探究 中国医科大学信息系(110001)吴明智 崔 雷∗ 本体(Ontology)是从哲学中引入的一个概念,牛津辞典对本体的释义是:“对于存在 的研究或科学(the science or study of being)”。近年来人工智能有关课题的研究进展 使这个词受到了人们的普遍关注,成了一个时髦的术语。 Gruber 在 1993 年给这个术语下了一个非常简明的定义:“概念体系的规范 (specification of conceptualization)”;1998 年Studer 等人在这个定义的基础上对于 本体的特点给出了一个更为明确和全面的解释:“本体是对概念体系的明确的、形式化、可 共享的规范说明”,并且进一步指出,知识本体是“领域知识规范的抽象和描述,表达、共 享、重用知识的方法。” 本体能提供生物医学概念及其关系的机读描述,文本中的概念同本体中关于此概念的描 述链接后可以为文本信息的语义解释提供基础。基于此本体可以支持文本信息的自动语义解 释,从而为复杂的文本挖掘提供基础。此外,文本挖掘的结果可以通过本体来表示和管理, 并促使生物医学本体的更新,使本体的内容同知识的增长保持同步。 因为本体可以用来组织知识库较高层次的知识抽象,也可以用来描述特定领域的知识, 所以在生物医学上的应用越来越广泛,因此,我们打算通过共词聚类分析的方法,对近年来 生物医学相关的本体方面的文献进行分析,总结当前本体在生物医学上的主要研究和应用方 向。 1 材料和方法 我们选用PubMed数据库作为研究文献的来源,因为检索词ontology没有正规的主题词形 式,所以我们用文本词ontology作为检索词在PubMed数据库中检索与本体相关的文献(时间 截止到2008年2月15日),以Citation格式下载这些文献。 用自编软件统计这些文献中的高频主题词,本文将出现频次在40次以上的主题词纳入到 生物医学相关的本体论研究热点的分析之中。计算这些高频主题词在同一篇文献中两两出现 的次数,形成共词矩阵,进一步计算得到其相关矩阵。之后利用SPSS11.5对相关矩阵的数据 进行聚类分析,聚类结果可以反映出这些主题词之间的亲疏关系。再将这些主题词返回到相 应的热点文献中,从而分析生物医学相关的本体论的研究现状。 2 结果及分析 共检索到相关文献2326 篇,出现频次超过40 次的主题词共30 个。高频主题词及其共 词聚类结果分别见如下的图表。 根据聚类图,可以看出与生物医学相关的本体的研究主要集中在如下7 个方面: 2.1 基因表达的信号传导研究。包括 5,9,10,19,26 号主题词。人们认识到,许多疾病 过程都涉及到信号传导的异常,于是往往把参与细胞信号传导的蛋白作为治疗的靶向。可是, 在研究的过程中,需要一种分析方法来将细胞应答与信号传导途相联系起来。有文献提出了 一种基于微阵列的分析方法,这种方法通过对基因注释以及对基因表达数据进行成分分析来 预测信号传导通路中的具体行为和具体的信号传导蛋白的活动。在利用基因本体和酵母菌基 因组数据库中的基因调控数据分析之后,作者识别出酵母菌细胞周期中包括细胞壁合成,蛋 白质合成的化学阻断等在内的转录过程。研究表明,通过使用基因本体或转录因子数据库, 微阵列数据可以指示出下游的信号传导通路活动,进而可以用来研究靶向治疗的特异性,并 ∗ 吴明智 (1983-),研究生。 用于阐释正常和疾病状态下的信号传导活动。 2.2 蛋白质的相关研究。包括8,20,16,30,22 号主题词。研究涉及蛋白质的结构功能、 分类,代谢,相关数据库以及序列分析的方法。有文章提到,传统的序列分析方法仅仅利用 了蛋白质之间的直接作用来推测其相关的功能,也有一些研究关注了蛋白质间的间接作用, 但是其预测性能较低。于是研究者针对此问题提出了FS 加权平均法,它通过拓扑加权及蛋 白质的间接作用来预测其功能。通过对从3 个不同的基因本体(GeneOntology,GO)中选取 的7 个基因组的分析,他们发现FS 加权平均法的分析结果要优于其他的分析方法,同时还 具有很强的健壮性;还有文章指出,目前通过实验证实的蛋白质的结构数据迅速增长,但是 其中一半的数据都不附带有相关的生物学信息,该研究者提供了这样能够自动并综合地解释 蛋白质功能的工具:AnnoLite 和AnnoLyze。这两个程序利用DBAli 数据库中存储的算法能 够比较准确的对蛋白质的功能进行解释,其敏感性和正

您可能关注的文档

文档评论(0)

bb213 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档