- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(
摘 要
近年来,互联网上的信息呈几何级数爆炸性增长,丰富多彩的网络资源给人们的生活工作以及学习带来巨大方便的同时,信息的浩繁,庞杂无序和动态性又极大地影响了用户获取信息的速度,准确性和有效性。海量的存贮和科学的信息搜索是用户信息行为中两种重要的能力,互联网的发展已经实现了信息的海量存贮,为了解决大海捞针似的信息搜索问题,搜索引擎便应运而生了。目前搜索引擎技术已成为计算机工业界和学术界争相研究和开发的热点技术。对于实现信息的,搜索引擎的体系结构设计成为关键。本文中所设计的搜索引擎,主要有个大的模块组成:一是抓取模块:实现了对网页信息的下载。是索引模块:实现了对网页信息的排序,索引。是搜索模块:实现了对网页信息的快速检索。是:实现了本系统是对网站数据及相关数据库数据进行搜索,管理配置了对应数据源和搜索途径,实现了对网络信息的快速搜索。关键词:搜索引擎;体系结构;
Abstract
Information on the internet grows geometrically and explosively in recent years. Diversified resources of network brought great convenience to peoples life. At the same time, the voluminous of information, and the dynamic and mixed disorganization also greatly affect the speed,the accuracy,and the effectiveness of accessing to information. Massive storage and searching of scientific information is two important capacity of information act. The development of the internet has achieved the storage of a mass of information. The search engine will come into being in order to solve the problem of searching information. At present,technology of search engine has become the hot technology of researching and developing in computer industry and academia.
For the achievement of massive searching of network information, designing of search engine architecture becomes the key of improving the efficiency of the search. The designing of search engines in this paper composed by four major modules. First is crawling modules: Implementation of the download page of information. The second is indexing modules: the search engine and data sources connected to the establishment, modification and removal. Third, the indexing module: to achieve the rapid indexing of network information. Fourth, the search modules: it realized the rapid retrieval of information pages.
This system is to search the site of data and data related to the database and management configuration of the corresponding data sources and it realizes rapid research of network information.
Keywords: Search engin
您可能关注的文档
- 绿色营销本科毕业论文(设计)万科地产绿色营销存在的问题及对策分析.doc
- 马克思物质概念与实践概念关系问题探析本科毕业论文(设计)设计.doc
- 毛则渠边坡加固工程立项建设施工—--组织设计.doc
- 媒介经营与管理论文--社区服务性学习(communityservicelearning)理念的躬身尝试.doc
- 民营企业员工流失问题及对策--人力资源管理本科毕业论文(设计).doc
- 闽西南工程立项建设设备物流园可行性分析报告.doc
- 某半导体公司库存成本分析与控制本科毕业论文(设计).doc
- 某抽水泵站设计本科毕业论文(设计).doc
- 某节水灌溉项目立项投资建设可行性分析报告.doc
- 某经济适用房建设项目立项投资建设可行性分析报告.doc
- 《企业和公司法(第六版)》教学课件.pptx
- 《陕西省建筑施工企业安全生产管理人员考试题库》建设工程安全生产管理-单选题.pdf
- 《陕西省建筑施工企业安全生产管理人员考试题库》建设工程安全生产管理-多选题.pdf
- 《陕西省建筑施工企业安全生产管理人员考试题库》建设工程安全生产管理-判断题.pdf
- 《陕西省建筑施工企业安全生产管理人员考试题库》建设工程安全生产管理-判断题.docx
- 《陕西省建筑施工企业安全生产管理人员考试题库》建设工程安全生产管理.xlsx
- 中学团委工作方案学校上学期.pptx
- 2.4+洋务运动和边疆危机++课件++2025--2026学年统编版八年级历史上学期.pptx
- 第三单元课外古诗词诵读+行军九日思长安故园、夜上受降城闻笛(素养进阶教学课件)语文统编版五四学制2024七年级上册.pptx
- 1.2.3温度的测量 课件 2025-2026学年浙教版科学七年级上册.pptx
文档评论(0)