- 2
- 0
- 约2.35千字
- 约 6页
- 2018-02-08 发布于江苏
- 举报
浅论一种医疗本体语义相似度算法的设计
浅论一种医疗本体语义相似度算法的设计
摘要:由于目前检索技术效率低下,所以需要一种基于本体的检索技术来提高效率。语义相似度计算是基于本体的检索技术的一个关键问题。本文对已有语义相似度计算方法进行总结并改进,最后对其进行分析。
关键词:本体;本体检索;语义相似度计算
1 引言
随着Internet的日益发展和普及,本体在信息采集、信息检索及本体集成等方面的应用越来越广泛。2002年12月18日Berners-Lee在国际XML2000的会议提出Semantic Web(语义网)的构想[1]。在Semantic Web中,语义相似度算法是实现基于本体的检索、采集等的关键问题。因此语义相似度算法的好坏成为信息检索效率高低的重点,于是改良语义相似度算法是一个迫切的问题。
关于语义的相关性,国内外专家已经做了大量的工作:Resnik根据两个词的公共祖先节点的最大信息量来衡量两个词的语义相似度。Agirre等在利用WordNet计算词语的语义相似度时,除了结点间的路径长度外,还考虑到概念层次树的深度、概念层次树的区域密度。鲁松研究了如何利用词语的相关性来计算词语的相似度。Li Sujian等提出了一种词语语义相似度的计算方法,计算过程综合利用了《知网》和《同义词词林》。朱礼军等引入了计算语言学中的语义距离思想来计算领域本体中概念间的相似度。
本文总结前人的经验,并将概念的数据类型考虑其中,这样概念的语义相似度就更加精确。
本体与领域本体
本体(Ontology)作为一种能在语义和知识层次上描述信息的概念模型,自被提出以来就引起了国外众多科研人员的关注,并在计算机的许多领域得到了广泛的应用,如知识工程、数字图书馆、软件复用、信息检索和Web上异构信息的处理、语义Web等。
本体的概念
目前对本体的定义有很多,专家们认为由Studer等人在1998年提出的“本体是共享概念模型的明确的形式化规范说明。[3]”最为精确。它包含4层含义:概念化(conceptualization)、明确(explicit)、形式化(formal)和共享(share)。
概念化:指通过抽象得出客观世界中一些现象(Phenomenon)的概念模型。
明确:指所使用的概念及使用这些概念的约束都有明确的定义。
形式化:指本体是计算机可读的(即能被计算机处理)。
共享:本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对的是团体而不是个体。
2.本体的分类
Guarino[5]在1997年对本体依照领域依赖程度,分为顶级(top-level)、领域(domain)、任务(task)和应用(application) Ontologies共4类。其中:
顶级Ontologies描述的是最普通的概念及概念之间的关系,与具体的应用无关,其他种类的Ontologies都是该类Ontologies的特例。
领域Ontologies描述的是特定领域中的概念及概念之间的关系。
任务Ontologies描述的是特定任务或行为中的概念及概念之间的关系。
应用Ontologies描述的是依赖于特定领域和任务概念及概念之间的关系。
本文主要就是基于领域Ontology来设计与研究语义相似度计算方法。
语义相似度计算
语义相似度是判断几个概念之间的语义的相似程度。在信息检索中,它反映的是用户查询关键词的意义上的符合程度。
语义相似度计算原则
语义相似度的计算原则是为了本体内部概念间相似度计算更加准确而提出的[2],其内容如下:
量化原则:相似度是一个数值,取值范围应该在[0,1]之间[3],如果两个概念完全相同,那么他们的相似度为1,完全不同,相似度为0。
简单性原则:计算相似度的同时应该考虑计算复杂度[4],复杂度应该尽量降低。
充分利用本体的特性。
可调节性:可调节性是指相似度的计算结果可通过某些参数来调节,词语相似度是一个主观性比较强的概念,可调节性可以满足不同的需求,适应不同的情况[2]。
类型性:在计算概念相似度的时候,也应该将概念的数据类型考虑其中,这样能提高概念相似度的精度。
对称性:Sim(C1,C2)= Sim(C2,C1),对称性有利于概念相似度之间的对比与换算。
3.相似度计算方法
本文建立了一个简单的医疗系统的本体,如图1所示。class:表示的是类,subClassOf:表示的是本体中最主要的关系,即概念之间子类的关系,也就是继承关系。例如:C0是C1,C2的父类,而C1与C2则是C0的子类。
利于OWL语言构建此本体
您可能关注的文档
- 浅探美术教育中审美教育本质的重要性.doc
- 流行音乐演唱元素在民族唱法中的运用与研究.doc
- 浅析ERP在国有投资公司财务管理中的应用.doc
- 浅析“互联网+”时代下的国际贸易.doc
- 浅析“半影推理”与“几何学模型”.doc
- 浅析《民法总则》中的诉讼时效制度.doc
- 浅析《美的历程》中的美学思想.doc
- 浅析一般人格权的立法保护 .doc
- 浅析中止犯减免处罚的根据.doc
- 浅析中英语言禁忌_0.doc
- 山西天一大联考2025-2026学年高二上学期期末学情监测语文试题(试卷+解析).docx
- 山西忻州部分学校2025-2026学年高一上学期2月质量检测数学试题(人教B版)(试卷+解析).docx
- 山西运城市2025-2026学年高二第一学期期末调研测试数学试题(试卷+解析).docx
- 陕西省榆林市榆阳区2025-2026学年八年级上学期期末地理试题(试卷+解析).docx
- 陕西西安市碑林区2025-2026学年度第一学期期末八年级生物试题(试卷+解析).docx
- 四川省广元市苍溪县2025-2026年八年级上学期期末道德与法治试题(试卷+解析).docx
- 江苏泰州市姜堰区2025-2026学年七年级上学期1月期末数学试题(试卷+解析).docx
- 江苏省扬州市邗江区2025-2026学年九年级上学期期末考试化学试题(试卷+解析).docx
- 江西上饶市铅山县2025-2026学年第一学期期末考试八年级数学试题(试卷+解析).docx
- 江苏扬州市高邮市2025-2026学年度第一学期期末学业质量监测试题九年级英语(试卷+解析).docx
原创力文档

文档评论(0)