结合编辑距离和google距离的语义标注方法分析-analysis of semantic annotation method combining editing distance and google distance.docxVIP

结合编辑距离和google距离的语义标注方法分析-analysis of semantic annotation method combining editing distance and google distance.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
结合编辑距离和google距离的语义标注方法分析-analysis of semantic annotation method combining editing distance and google distance

摘要Web 已经成为人类获取信息和得到服务主要方式之一,Internet 技术的高速发 展使它成为了一个庞大的知识库,但同时也带来了许多问题。首先,Web 规模的 膨胀使得整个 Web 上的有用信息无法得到有效的利用,人们在这海量的信息中获 取“知识”的难度增大;其次,在当前 Web 中计算机的主要作用是显示信息,很少 参与到信息的处理中,使得许多智能应用无法在 Web 上实现。语义 Web 便是在这 种需求背景下产生的,旨在使 Web 文档具有机器可理解的语义,使不同平台中的 数据得到共享和重用,便于人机之间进行交流和合作。这样,Web 巨大的潜能才 能得到充分发挥。这种机器可理解的语义信息,就是通过语义标注技术产生并添加到 Web 资源 中的。语义标注是利用本体知识对网页中的概念或概念实例进行描述的。通过语 义标注的作用,Web 中的资源具有了语义,因此语义标注是实现语义 Web 的基础。本文首先介绍了语义 Web 相关知识背景,包括语义 Web 的起源、体系结构、 本体知识等,阐述了语义标注的含义、它与本体之间的相互作用,以及在语义 Web 发展过程中的重要地位。然后,对当前存在的一些典型的语义标注系统进行深入分析和比较。针对这 些标注系统的不足和缺陷,引入了语法和语义分析的思想,提出了一种结合编辑 距离和 Google 距离的语义标注方法。该方法在领域本体的指导下,充分考虑了 Web 资源与本体在语法上的形似度和语义上的相关度,从这两方面综合度量两者 之间的关联程度,从而用本体知识对资源进行有效的标注。其中,对标注结果还 进行了分类处理:与本体关联程度高但在本体中尚无定义的实例,将其标注结果 反馈到本体库中,对本体库进行扩充;与本体关联程度低的实例则反馈到词汇过 滤表中,用于辅助对文档的预处理过程,这两个过程都是循环反馈的。其次,在对传统标注工具分析时发现这些工具几乎都无法直接标注 word 文档, 为此,对 word 文档的特点分析后,将本文方法改进后直接标注 word 文档。最后,为了验证本文提出的语义标注方法的有效性,在葡萄酒领域设计和实现了语义标注实验。在实验中,分别针对 Web 文档和 word 文档进行了相应的测试。 结果表明,本文提出的方法切实可行,标注性能良好,对领域文档的表达方式没 有特别要求,并支持对 word 文档的语义标注,弥补了传统标注工具几乎无法直接 标注以 word 文档表示的资源的不足之处。关键词:语义 Web,语义标注,本体,编辑距离,Google 距离IABSTRACTThe web has become one of the main ways for people to obtain information and services, which has also become an enormous knowledge base, along with the rapid development of Internet technology. At the same time, a lot of problems arise. First of all, the expansion of the web scale makes that the useful information on the web cannot be used effectively, so that, it is difficult for people to gain “knowledge”. Then, the computer mainly plays the role of displaying information, and hardly processes the information, which results in the incapability of intelligent applications. As a result, the Semantic Web is proposed to make web documents have machine-understandable semantics to share and reuse various data in different platforms, so that computer can communicate and cooperate with people. So, the enormous potential of web can come out.The machine-understandable semantic information is produced and added to the we

您可能关注的文档

文档评论(0)

xyz118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档