- 1、本文档共68页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
搜索引擎相关技研究
摘 要
摘 要
Internet上面的信息数量与日俱增,使得互联网的使用者已经很难以地址栏
输入地址或简单的导航网站准确、有效地找到所需的内容信息。那么,如何才能
解决这个问题呢,答案是唯一的:搜索引擎。搜索引擎如今已然成了互联网使用
者在网上查找他们所需内容信息的不可或缺的检索工具。所以,这就使得专家学
者们对搜索引擎的研究越加重视,近几年搜索引擎的各种相关技术都有了长足的
进步,并且相继出现了像Baidu、Google、Yahoo等这样优秀好用的搜索引擎。因
为互联网上面的信息内容正在爆炸般得方式增长,那么互联网使用者依赖搜索引
擎的程度也就越来越深,搜索引擎技术发展的机遇由此到来了,同时,这也使得
前所未有的挑战降临到了搜索引擎领域。与搜索引擎相关的技术有很多方面,它
们当中的底层的分布式文件存储系统则是相当重要的一个方向。因此本文其中的
一个研究部分就是对搜索引擎之中的底层的分布式文件存储系统的分析和优化,
目的是通过提高底层分布式文件存储系统的性能,来最终达到使其上层的搜索引
擎其他部分应用可以拥有更好的性能。由于最近搜索引擎领域之中的语义检索方
向已成为一个热点,所以本文的第二个研究部分就是搜索引擎之中的语义级别检
索,我们利用的是本体论的方法来建立语义关联空间,之后运用语义关联空间来
实现语义级别的检索。最后一个部分我们讲讨论当前也十分流行的XML
(Extensible Markup Language,也就是可扩展标记语言)数据上的搜索引擎的
检索算法,我们将会论述分析当前比较流行的XML检索算法,并提出我们的优化
策略。
关键词:搜索引擎; 语义关联空间; 检索算法; 分布式文件存储
I
ABSTRACT
ABSTRACT
The increasing number of information on the Internet, making the Internet users
already very difficult to address bar input address or simple navigation website
accurate, effectively find the necessary information. So, how to solve this problem?
And the answer is the only: search engine. Search engine now has become Internet
users in the Internet to find the information they need the indispensable retrieval tool.
So, this makes specialists and scholars to the search engines research in recent years
more seriously, search engine all sorts of relevant technology has made considerable
progress, and successively appeared like Baidu and Google, Yahoo with such good
search engine. Because the Internet information content is explosion on the way, so a
growing Internet users rely on search engine degree are increasingly deep, search
engine technology development opportunities which arrived, meanwhile, it also
makes the unpr
文档评论(0)