- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
运用结晶方法提高领域本体构造.doc
运用结晶方法提高领域本体构造
.
简介
本体是一种模型其定义是具有明确规范的领域知识这特征在人与机器中起到相互操作性作用,因此在知识分享与重用方面需要解决模糊性和含糊其辞的问题。由于其能力在提高知识代表性和重用性,本体在一些像知识管理,情报探索,信息整合,生物信息学等领域中得到了更广泛的运用。按照本体的重要性,本体构造结构被看作是一个比较突出的问题。本体构造是个漫长的,成本高的,有争议性的工作。因此,在自动化本体构造方面出现了很多研究项目。比如;可汗和罗的自我组织树算法(SOTA)。Navigli, Velardi, and Gangemi (2003), 也根据领域文档,运用wordnet 和 semcor 提取语义,最后完成本体结构。另一方面,Weng, Tsai, Liu, and Hsu (2006) 形式概念分析法解剖了概念关系。Li and Ko (2007) 运用层次分簇算法为糖尿病患者的饮食问题倒置本体的构造方法。但无论是运用各种理论和科技,自动化本体构造还是涉及到了三个构造过程:文档预处理,概念提取和概念关系的探索(Chen, Liang, Pan, 2008; Dahab, Hassan, Rafea, 2008; Gómez-Pérez Manzano-Macho, 2004).
文档预处理指的是在文档维持其意义时滤波噪音。概念提取指的是在词汇学方面提取领域概念。概念关系探索指的是采掘关系和概念,并且组织它们完成本体建造过程。在这过程中概念与此概念关系组织的方式会影响本体的构造。这相反会影响领域知识的准确性。因此,在本体构造中概念关系探索被视为构造本体最重要的过程。现存的概念关系探索过程主要有Uschold and Grüninger (1996)提出的以下三个方法。;“由上往下”方法,“由下往上”方法和“由中间开始”方法。这些方法有自己的优点和缺点。(Fernández-López Gómez-Pérez, 2002). “由下往上”方法鉴别第一项最显著的概念并把他们总结成更抽象的概念。但这方法很难在相关概念中发现其共同点。“由上往下”方法从顶头开始能够选择和加强任意高级分类。“中间开始”方法识别了基本核心概念并且对其经行分类和总结。这方法相反在细节级别发面保持平衡并且要求更少的重新运作,这能够导致更少的整体工作。这项研究提出概念关系探索方法结合了“中间开始”方法和“由上向下”方法的特征并且集合了雪花状结晶。
当蒸汽附加到一个尘粒形成冰晶体时雪花开始结晶。冰晶体再使周围的蒸汽结块并逐渐的扩散成更大的冰晶体,这最终形成雪花。在蒸汽结块过程中冰晶体相对来讲比较坚固,在蒸汽结块过程中冰晶体是其最核心组成部分。这种凝聚作用在蒸汽的距离从核心上涨时降低了其凝聚力另外,由上向下探索方法 (Chen et al., 2008; Dahab et al., 2008; Gómez-Pérez Manzano-Macho, 2004), 这项研究提出了普通本体构造步骤 (Fig. 1)OpenNLP (Sánchez Moreno, 2008), CKIP (Lee et al., 2007) and WordNet (Miller, 1995).
2.概念提取
根据词汇和同义词的关系概念提取利用一种领域词库或主题地图识别概念。但文档存在一些与不合逻辑的命名相关的问题这在同义词和同音词中出现,导致语义歧义且调和概念提取方式的准确性。大部分之前的研究依靠领域词库解决语义歧义问题并对词汇学中的下义词和同义词下定义。(Kietz, M胐che, Maedche, Volz, 2000; Tan, Han, Elmasri, 2000).
普通本体构造过程
Document set; 文档设置
Domain expert; 领域专家
Ontology engineer; 本体工程师
Document preprocess; 文档预处理过程
Concept extraction; 概念提取
Relation exploration; 关系探索或解剖
3.概念关系探索
概念关系探索指的是挖掘概念与组织概念之间的整体关系。提取概念中的关系是很重要的。这领域中的很多研究项目运用“从上往下”,“从下往上”和“中间开始”等方法探索概念(Uschold Grüninger, 1996),有如下方法;
1. 由上往下;概念探索从最基本的概念开始,被称之为种子概念。
2.从下往上;概念探索从最基本的概念开始,识别底水平概念并向上上涨覆盖更多的基本概念。(Khan Luo, 2002; Park, Nam, Hu, Suh, 2008);
3. 中间开始;被视为最显著的概念并定位中级别概念。但所有这些方法都有其独特的优点
您可能关注的文档
最近下载
- 小学体育三年级下册全册教案表格式小学体育三年级下册全册教案表格式.doc VIP
- (2025)冠脉介入培训试题答案.docx VIP
- 毛利人的传统文化.pptx VIP
- 新西兰毛利文化课件.pptx VIP
- 固体物理学 -课件(3.1.1)--第三单元课件.pdf VIP
- 小学三年级上册体育计划及教案(全册)(表格式107页).doc VIP
- Dell戴尔Dell 32 Plus 4K QD-OLED显示器 - S3225QC用户指南.pdf
- 部编版小学二年级下册道德与法治第三单元《绿色小卫士》教材解读.pdf VIP
- 遗失补办户口本授权委托书.doc VIP
- 2020年自考《播音与主持创作基础》练习试题及答案.doc VIP
文档评论(0)