logo

您所在位置网站首页 > 海量文档  > 专业论文 > 论文指导设计

面向语义网地语义搜索引擎关键技术研究.pdf 128页

本文档一共被下载: ,您可全文免费在线阅读后下载本文档。

  • 支付并下载
  • 收藏该文档
  • 百度一下本文档
  • 修改文档简介
全屏预览

下载提示

1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
特别说明: 下载前务必先预览,自己验证一下是不是你要下载的文档。
  • 上传作者 cxmckate(上传创作收益人)
  • 发布时间:2016-01-05
  • 需要金币200(10金币=人民币1元)
  • 浏览人气
  • 下载次数
  • 收藏次数
  • 文件大小:5.73 MB
下载过该文档的会员
你可能关注的文档:
独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及u丈得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中/fi也龠其他 人已经发表或撰写过的研究成果,也不包含为获得北京J2,Jk大!学或其它教育杓眯J 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的f肼t】f确跌均 己在论文中作了明确的说明并表示了谢意。 关于论文使用授权的说明 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校自+十义 保留送交论文的复印件,允许论文被查阅和借阅:学校可以公布论文的全部或部 分内容,可以采用影印、缩印或其他复制手段保存论文。 (保密的论文在解密后应遵守此规定) l v 同期: 0 I t 摘 要.. 摘要 语义网是当今互联网的发展趋势,语义网环境下的文档拥有丰富的语义信 息,这为数据的语义处理提供了基础。面向语义网的语义专题搜索引擎将充分的 利用语义网丰富的语义信息作为出发点,通过分析语义文档中的语义标注和本体 的知识表示使得用户针对某一个专题进行精确的搜索成为可能,面向语义网的语 义专题搜索引擎的关键技术研究对推动互联网技术的进一步发展以及语义网的 普及具有重要意义。 面向语义网的语义专题搜索引擎包括语义专题爬虫、本体映射器、实体融合 器、语义索引器以及用户界面几个主要部件。本选题主要研究内容包括以下四个 方面: (1)计算本体概念之间相似度的新方法。方法除了考虑概念的属性相似 度对概念相似度的影响以外,还将两个概念之间存在多条路径连接的情况纳入了 考虑范围。 (2)语义专题爬虫的路径调整算法。通过计算页面主题相关度计算 作为Q学习器的回报函数,并采用用户操作数据对回报函数的参数进行调整, 提高爬虫获取主题相关语义文档的性能。(3)结合多种本体元素的相似度的本 体映射方法。映射方法除了考虑到本体的语言相似度和结构相似度以外,还加入 了本体实例的相似度作为映射结果的参考因素。(4)语义信息的语义分级索引。 语义分级索引从多种索引对象出发,分析对象的特点,建立索引逐步引导用户通 过快速查询逼近真正的查询意图。 论文在以下方面作了有益的探索和创新性工作。 (1)对语义网以及语义搜索引擎的特点进行了分析,指出了目前的语义搜索 引擎的局限性,并在此基础上提出了一种基于语义解析和处理的面向语义网的专 题搜索引擎框架(以下简称FSTSE),并且对框架中的各个部件的工作流程和 作用进行了阐述。FSTSE为以下的各个方法研究提供了基础。 (2)在FSTSE的框架下,针对语义专题爬虫的路径调整算法进行了分析和阐 述。面对大量位置分散的语义文档,对文档内容的分析以及爬行路径的预测和筛 选显得非常重要。本文提出了利用WordNet本体作为指导的语义文档图形表示 方法,方法可以准确的将语义文档的内容表示为图形结构。在此基础上,本文提 出了由Q学习器通过学习为Bayes分类器提供先验概率的QBLP爬虫路径调整 算法。QBLP方法通过累计语义文档和语义链接特征的知识,调整爬虫爬行路径, 提高爬虫的性能。这个目标在实验中得到了验证。 (3)针对语义网应用普遍存在的本体异构问题,本文提出了结合多种本体元 素的相似度的本体映射方法。除了本体映射方法中常用的语言相似度和结构相似 度以外,本文还对概念实例的相似度计算方法进行了研究,并提出了一种判断簇 内样本纯度的衡量标准——信息熵纯度。通过对聚类形成的簇的信息熵纯度来分 北京T业大学工学博士学位论文 析本体中拥有实例集合的概念之间的相似度。实验表明,这种本体映射方法表现 出很高的性能。 (4)为了提高语义搜索引擎的查询效率,本文对语义信息进行了不同粒度的 解析,建立了多级的语义索引结构,日的是为了满足用户针对语义信息不同的查 询需求。分级索引包括文档、聚类、路径和三

发表评论

请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
用户名: 验证码: 点击我更换图片

“原创力文档”前称为“文档投稿赚钱网”,本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有【成交的100%(原创)】。原创力文档是网络服务平台方,若您的权利被侵害,侵权客服QQ:3005833200 电话:19940600175 欢迎举报,上传者QQ群:784321556