- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
--(完美WORD文档DOC格式,可在线免费浏览全文和下载)值得下载!
主题搜索引擎的研究与设计
摘 要
网上的信息每天都以指数量级的速度爆炸性增长,面对nternet中令人眼花缭乱的资源,如何地找到所需的信息已成为众多信息检索人员面临的一个必须解决的问题搜索引擎在这方面Internet用户提供了一种快速准确地搜索到符合自己需求的信息的工具。在实验系统中,用户可以根据选择的主题来进行搜索,系统通过相关度分析对搜索的结果进行排序。另外还分析了研究该课题的意义及课题尚待解决的问题。最后,通过对实验结果的分析,进一步强调了研究主题搜索引擎系统的意义。
关键词:互联网,搜索引擎,主题搜索
ABSTRACT
Information on the Internet grows explosively every day. How to find information accurately and quickly from the Internet has become a problem. Many people who want to retrieve information respect to solve this problem. In this aspect, search engine is a powerful tool.
A topic search engine system is proposed and designed in this paper. The theory of the common “spider” is analyzed. The main algorithm about the topic search is researched. On the base of the research, a topic search engine is designed. It combines the content-based method and hyperlink-based method. It aims at helping the user to get Internet information according to their own demands fast and accurately. In the research system, people can search by choosing their topic. Then the system will sort the result after the relativity analyse. In addition, the significance of the research on this system is analyzed, and the unsolved problems are also discussed. Finally, a test stem of Topic Search engine is designed ,and the result of the experiment is given.
Keywords:Internetearch Engine, Topic Search
目 录
1 引言
1.1 课题背景
1.1.1 Internet的发展历程
Internet的历史可追溯到30多年前,它的前身是1969年美国国防部高级研究所计划局(ARPA)[1],作为军用实验网络而建立,名为ARPANET,初期只有四台主机,其设计目的是当网络中的一部分因战争原因遭到破坏时,其余部分仍能正常运行,而这些分散的点又能通过某种形式的通讯网取得联系。为对这一构思进行验证,自从六十年代末至七十年代初,由美国国防部所资助,一个名为Advanced Research Project s Agency的公司所承建,通过一个名为ARPANET的网络把美国的几个重要军事及研究所用的计算机主机联接起来,这就是Internet最早的形态。
目前,几乎所有发达的国家都建设有自己国家级的教育和科研计算机网络,并且都与Internet互连在一起,中国也不例外。由于Internet上具有极丰富的资源,它突破了地理位置的限制,为广大的入网人员提供一个很好的计算机环境,大大加快了人们之间的信息交流和合作。可以说,Internet拉近了人们彼此之间的距离。
随着计算机和通信事业的飞速发展,计算机网络由过去的军事和教育专用网络发展成为包罗万象的国际互联网络Internet。我们可以通过Internet来查找各种资料、做广告、发布信息、通信、发传真、在线交谈、在线转播和举行会议。Internet已经成为与我们的生活和工作密切相关的一部分了。
1.1.2 World Wide Web(WWW)
W
1亿VIP精品文档
相关文档
最近下载
- 赣美版小学美术五年级下册第十册《门和窗》教学课件.pptx VIP
- 特殊教育生活语文人教课标版二年级上册(2018)_培智类语文学科二年级上册《爬山》教学设计 公开课教.docx
- 无人机驾驶航空试验基地(试验区)基础设施使用、管理规范.pdf VIP
- 2023小学生宪法知识竞赛培训试题及答案.doc
- 2020-2021学年辽宁省沈阳市级重点高中高一(下)期中数学试卷(附答案详解).docx VIP
- 西安交通大学的集成电路设计课件.pdf
- 利用几何直观 揭示数学规律——“钉子板上的多边形”优秀教学片断及思考.doc VIP
- 2024届高考政治备考:经济时政热词.pdf VIP
- 《上海市残疾人托养服务发展现状、问题及完善对策研究》16000字.docx
- 体育与健康 单元作业设计 八年级 第二学期人教版 排球 .pdf
文档评论(0)