- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
垂直搜索引擎关键技术研究与实现-软件工程专业论文
摘 要
随着互联网的飞速发展,用户对于信息搜索的需求不断提升,特别是在垂直 领域对搜索引擎的要求全面提升,主要包括搜索多层排序、智能搜索、关键词联 想、信息自动抽取及关键词高亮等几个核心技术。
本论文正是针对上述几个核心技术点,以互联网音乐垂直领域搜索应用为主 要研究对象,在深入分析当前开源搜索引擎 lucene 的基础上,结合垂直领域搜索 引擎的个性化需求,对垂直领域搜索引擎算法进行了详细的研究和开发,并开发 出一个通用的垂直搜索引擎框架。主要内容包括以下几个部分:
本文通过研究开源搜索引擎 lucene,并对上述核心技术算法重新设计和实现, 开发出一套通用的垂直搜索引擎框架。
解决搜索结果线性排序方式单一问题。垂直搜索引擎对搜索的结果排序方式 要求要比普通的综合搜索引擎高,搜索结果要求更精确,需要按照多种层次进行 精确排序,本文实现一种分层排序算法来实现解决目前搜索引擎单层排序问题。
解决搜索深度不够问题。目前的搜索一般通过文字内容匹配的方式得到对应 的搜索结果,这样的搜索只能做到简单的字符配对。本文通过二维空间得分计算 的算法建立智能属性来解决深度搜索问题,实现智能搜索。
解决数据智能处理力度不足问题。目前从网页中抽取信息时一般采用编写正
则表达式或者配置网页模板的方式进行信息抽取,相对于搜索引擎需要对全网海 量的数据进行实时处理,无法依靠人力编写如此之多的正则表达式和模板,本文 通过粗糙集算法建立多维约束数据抽取方式实现新闻类网页的内容智能抽取。
设计并实现关键词联想算法。目前搜索引擎为了简化用户的输入成本而提供 了关键字联想功能。本文设计了一种搜索引擎关键字提示内容生成及更新方法, 具有高效的关键词联想效率及多种策略功能。。
设计并实现搜索关键词高亮算法。本文旨在设计一种关键信息显示方法,特 别对超长文本的关键词高亮显示技术,设计了一种基于哈希查询算法的技术方案 来实现关键词的快速高亮显示功能。
关键词:搜索引擎,多层排序,智能属性,关键词联想,关键词高亮
I
ABSTRACT
With the rapid development of the Internet, users demand for information search keeps rising, especially in the vertical field of search engines, core technology includes multi-layer sorting search, intelligent search, keyword association, automatic information extraction and keyword highlight and so on.
Target to address the problem, this paper uses music search application as the main research object, based on in-depth analysis of current open source search engine, combined with personalized demands for vertical field search engine, carries out detailed research and development on the vertical field search engine algorithm. The main contents are:
Through the research on open source search engine lucene, re-design and
optimization its core technology algorithms, developed a set of universal vertical search engine framework.
Solve the problem of single layer sort mode of search results. Vertical search engine has higher requirement of search results sort mode than ordinary comprehensive search engine, which require more accurate search results, and multi-layers sort reference. A multi-layers sort algorithm is dev
您可能关注的文档
- 反扭曲向列相液晶的波导研究-理论物理专业论文.docx
- 反拉弧圈球在世界优秀男子乒乓球运动员技术中运用的研究-体育教育训练学专业论文.docx
- 反拱水垫塘底板块振动特性的研究-水力学及河流动力学专业论文.docx
- 反文化运动的真理观及其局限美国二十世纪六十年代后期到七十年代初反文化运动的认识论-外国语言学与应用语言学专业论文.docx
- 反文化运动的真理观及其局限美国二十世纪六十年代后期到七十年代初反文化运动的认识论研究-外国语言学与应用语言学专业论文.docx
- 反拱水垫塘拱圈底板动水压强变化规律的研究-水力学及河流动力学专业论文.docx
- 反本质主义语境下的文学本质问题-文艺学专业论文.docx
- 反模仿的说话人再确认的研究-电路与系统专业论文.docx
- 反求工程中复杂自由曲面协调设计及拓扑还原技术研究-机械制造及其自动化专业论文.docx
- 反求工程在摩托车覆盖件开发中的应用研究-车辆工程专业论文.docx
- 垂直搜索引擎在校园网中的研究与应用-通信与信息系统专业论文.docx
- 垂直搜索引擎在烟草行业的研究与应用-计算机科学与技术专业论文.docx
- 垂直搜索引擎的主题网页抓取策略研究-计算机应用技术专业论文.docx
- 垂直搜索引擎系统的研究与设计-软件工程专业论文.docx
- 垂直搜索引擎系统的分析与设计-计算机软件与理论专业论文.docx
- 垂直搜索引擎主要技术分析-软件工程专业论文.docx
- 垂直搜索的算法研究计算机软件与理论专业论文.docx
- 垂直棒束通道内气液两相流流动特性实验研究-动力工程及工程热物理专业论文.docx
- 垂直气井流体相特性研究-油气井工程专业论文.docx
- 垂直流人工湿地LDHs覆膜改性沸石基质净化效果研究-市政工程专业论文.docx
原创力文档


文档评论(0)