Web挖掘中搜索引擎的的分析研究.pdfVIP

  • 4
  • 0
  • 约6.17万字
  • 约 51页
  • 2017-09-15 发布于安徽
  • 举报
摘要 摘 要 随着互联网的快速发展与广泛应用,网络上的信息量几乎每天以百万级的速度增 长,互联网已成为当今人们获取所需资源和信息交流的主要场所。Intemet是一个开放 的网络,网络中的信息具有分布、动态、异质、复杂、开放性及海量数据的特点,没有 统一的管理和结构,使得人们很难很快搜索出真正需要的信息,如何快速、准确地从浩 瀚的信息资源中找到有用的信息是网络用户面临的一个大问题,因此希望有新的工具来 定位信息资源。 网络信息搜索技术结合了现代信息检索技术和www的相关技术,旨在研究开发 出一个智能化的搜索软件,能在网络上自动地进行信息发现和索引,建立结构化索引库, 向用户提供查询服务,这种技术的呈现给用户的表现就是搜索引擎。 随着互联网的迅猛发展,搜索引擎的发展越来越需要借助各种技术来进一步推动。 作为数据挖掘中新的研究内容的Web挖掘,由于自身在信息处理中的层次较高,与搜 索引擎的关系非常密切,对搜索引擎技术有很大推动、辅助作用。所以搜索引擎通过应 用Web挖掘技术,可以增强信息处理能力,使得信息检索发展到一个新的水平。搜索 引擎中一个很重要的关键点就是把搜索到的页面中最重要的信息展现给用户。这就涉及 到网页的排序问题。 本文在首先学习了Web挖掘和搜索引擎的基础知识,分析了两者之间的区别,指 出Web挖掘对搜索引擎发展的辅助作用,并引出本文研究对象——PageRank算法。 basedon level)算法,并在PRP算法的基础上进行分析完善,提出了 (PageRankPage BPP(Basedon PageRank’s 法比PageRank算法具有一定的优越性。 关键词:Web挖掘;搜索引擎;PageRank;PRP;BPP ABSTRACT informationon AstheInteract’S andwide amountof rapiddevelopmentapplication,the the to hasbecome thenetincreasesmillions peoples’mainwayget by everyday.Intemet iSan network· infcIrrnation.Intemet and venueforthe of resourcesthe open primary exchange hasthecharacteristicsof Theinformationonthenet unified and hasno amountsofdata.Theinformation management complex,open,andlarge therealneeds.Howtofinduseful to searchout

文档评论(0)

1亿VIP精品文档

相关文档