基于知识图谱的搜索引擎技术研究及应用.docVIP

下载本文档

86
0
约5.78万字
约 72页
2020-09-28 发布于安徽
举报
版权申诉

基于知识图谱的搜索引擎技术研究及应用.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

PAGE II PAGE III 论文题目基于知识图谱的搜索引擎技术研究及应用专业学位类别学号 ***** 作者姓名 ***** 指导教师 ***** 摘要摘要互联网的迅速普及以及数字信息的爆炸式增长带来了宝贵的信息数据财富，尽管这些数据已经被分门别类，但是从成千上万的类别及其子类中检索有效信息对于搜索引擎也是较大的挑战。传统的搜索引擎通过对互联网中的数据进行全文索引，通过关键词匹配索引的方式进行信息检索并返回给用户相关的链接。这种检索方法不能准确理解用户的需求，同时返回的是相关链接而不是用户需要的信息，用户需要从链接的文档中查找相关的信息。为了改善上述传统搜索引擎的弊端，基于知识的搜索引擎引起了研究者和产业界的广泛关注。其主要思想是通过在互联网中进行数据获取，完成数据到知识的转变形成知识网络并提供信息检索功能。本文研究特定领域内的该类型搜索引擎的搭建相关理论及实现方法，希望通过该搜索引擎能够提供特定领域内的实体查询，即通过深度理解用户需求，从实体库中检索出相关实体返回给用户。围绕搭建领域内基于知识图谱的搜索引擎，研究基础搜索引擎框架，网络爬虫，数据索引，知识抽取，图谱模型等关键技术,主要工作包括：（1）提出一种基于本体库的知识抽取方法。通过领域内的本体库，判断从互联网中抓取的数据是否是领域内相关的实体，并从数据中抽取出实体相关的知识碎片，最后融合知识碎片形成领域内的知识。实验证明，这种方法的知识抽取相比传统的基于规则的抽取方法抽取范围更为确定，抽取的知识也较为准确。（2）提出一种基于Lucene的增量索引方法。通过分析Lucene框架以及Lucene的倒排索引和段合并机制，研究Lucene索引实体数据时性能较差的缺点，提出了通过多级索引文件代替索引库的索引方法，实验证明这种方法能够在一定程度上降低实时更新索引库时的耗时且对于检索请求响应更为敏捷。（3）实现了一个“机器学习”领域内的搜索引擎，用来提供相关实体的检索，其中实体主要包括文献，专家，期刊以及领域内相关概念。该搜索引擎以图谱的形式组织领域内的实体以及实体之间的语义网络，不仅提供了信息检索功能，通时提供了更加智能的结果排序以及相关推荐等功能。关键词：搜索引擎知识图谱知识抽取实体索引本体库 ABSTRACT ABSTRACT ABSTRACT With the rapid spread of Internet and explosive growth of digital information, the internet has brought a wealth of valuable information data, although these data have been categorized, but retrieve useful information from thousands of classes and subclasses still can be a big challenge. Traditional search engines via full-text indexing of data from the Internet, and return links of related documents or web pages by matching key words. This kind of search engines can not accurately understand the need of users, followed by the return of links rather than directly information needed of the users, users still need to find the information they need from the linked documents. In order to improve the above drawback of traditional search engines, Knowledge-based search engines is widely used and the main idea of this kind of search engine is through crawling data from web and translate data to knowledge and then form the knowledge graph, final