主题搜索引擎及研究设计.doc

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
--(完美WORD文档DOC格式,可在线免费浏览全文和下载)值得下载!

主题搜索引擎的研究与设计 摘 要 网上的信息每天都以指数量级的速度爆炸性增长,面对nternet中令人眼花缭乱的资源,如何地找到所需的信息已成为众多信息检索人员面临的一个必须解决的问题搜索引擎在这方面Internet用户提供了一种快速准确地搜索到符合自己需求的信息的工具。在实验系统中,用户可以根据选择的主题来进行搜索,系统通过相关度分析对搜索的结果进行排序。另外还分析了研究该课题的意义及课题尚待解决的问题。最后,通过对实验结果的分析,进一步强调了研究主题搜索引擎系统的意义。 关键词:互联网,搜索引擎,主题搜索 ABSTRACT Information on the Internet grows explosively every day. How to find information accurately and quickly from the Internet has become a problem. Many people who want to retrieve information respect to solve this problem. In this aspect, search engine is a powerful tool. A topic search engine system is proposed and designed in this paper. The theory of the common “spider” is analyzed. The main algorithm about the topic search is researched. On the base of the research, a topic search engine is designed. It combines the content-based method and hyperlink-based method. It aims at helping the user to get Internet information according to their own demands fast and accurately. In the research system, people can search by choosing their topic. Then the system will sort the result after the relativity analyse. In addition, the significance of the research on this system is analyzed, and the unsolved problems are also discussed. Finally, a test stem of Topic Search engine is designed ,and the result of the experiment is given. Keywords:Internetearch Engine, Topic Search 目 录 1 引言 1.1 课题背景 1.1.1 Internet的发展历程 Internet的历史可追溯到30多年前,它的前身是1969年美国国防部高级研究所计划局(ARPA)[1],作为军用实验网络而建立,名为ARPANET,初期只有四台主机,其设计目的是当网络中的一部分因战争原因遭到破坏时,其余部分仍能正常运行,而这些分散的点又能通过某种形式的通讯网取得联系。为对这一构思进行验证,自从六十年代末至七十年代初,由美国国防部所资助,一个名为Advanced Research Project s Agency的公司所承建,通过一个名为ARPANET的网络把美国的几个重要军事及研究所用的计算机主机联接起来,这就是Internet最早的形态。 目前,几乎所有发达的国家都建设有自己国家级的教育和科研计算机网络,并且都与Internet互连在一起,中国也不例外。由于Internet上具有极丰富的资源,它突破了地理位置的限制,为广大的入网人员提供一个很好的计算机环境,大大加快了人们之间的信息交流和合作。可以说,Internet拉近了人们彼此之间的距离。 随着计算机和通信事业的飞速发展,计算机网络由过去的军事和教育专用网络发展成为包罗万象的国际互联网络Internet。我们可以通过Internet来查找各种资料、做广告、发布信息、通信、发传真、在线交谈、在线转播和举行会议。Internet已经成为与我们的生活和工作密切相关的一部分了。 1.1.2 World Wide Web(WWW) W

文档评论(0)

mghkfg58 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档