- 3
- 0
- 约2.45千字
- 约 6页
- 2017-03-03 发布于北京
- 举报
利用集中网站进行WEB搜索的优化策略.doc
利用集中网站进行WEB搜索的优化策略
【摘 要】提高Web信息搜索的效率,改善搜索的性能,是信息检索领域一个重要的研究课题。本文利用爬山算法求得针对特定类别的最小集中网站集,再通过网页聚类,找到能获得最完全而准确信息的网页序列,从而提高Web搜索的速度和准确率。 【关键词】Web信息搜索 集中网站 爬山算法 聚类 相似度 搜索引擎(Search engine)是目前Web信息检索的主要工具,它所提供的导航服务已经成为互联网上非常重要的网络服务,但在查询速度与查准率、查全率等方面还具有较大的局限性。研究发现,网站集合中的一部分网站就已经包含了几乎全部网页信息,这样的最小覆盖网站子集被称为集中网站[1],因此找到这样的集中网站就可以提高搜索引擎的搜索效率。另外,分析Web网页间的超链接结构并充分利用,可以提高检索的质量。基于这种超链分析的思想,在1998年,Serger Brin和Lawrence Page提出了PageRank[2]算法。同年,J.Kleinberg提出了HITS[3]算法,还有其他一些研究者相继提出了一些改进算法,如SALSA、PHITS等,在实际应用中取得了良好的效果。 由于最小集中网站是针对某一特定分类而言,因此下面的工作是假定在已得到某一特定类网站集的基础上而做的。 求集中网站的问题可以看作是求图的最小顶点覆盖问题,经证明是NP完全问题,考虑采用一种启发式
您可能关注的文档
- 创新农业技术推广体系探索.doc
- 创新思维下的文保分局干部素质建设探索.doc
- 创新思维在初中数学教学中的运用.doc
- 创新教学 强化习惯.doc
- 创新教育在初中数学中的应用.doc
- 创新是班主任打通蜀道的生命力.doc
- 创新是突破困境的利器.doc
- 创新突破、挖潜增效优化热采井空心掺水杆柱管理模式.doc
- 创编体育游戏与教学中的运用.doc
- 创设“生物”问题情景 引发学生自主探究.doc
- 2026年山东省滨州市惠民县中考化学一模试卷(含答案).pdf
- 2026年山东省济南市历城区中考化学二模试卷(含答案).pdf
- 2026年山东省烟台市福山区中考化学模拟试卷(含答案).pdf
- 2026年山东省临沂市郯城县中考化学一模(含答案).pdf
- 2026年四川省德阳市中江县中考化学二诊试卷(含答案).pdf
- 2026年四川省绵阳市梓潼县中考化学二模试卷(含答案).pdf
- 2026年新疆乌鲁木齐市沙依巴克区中考化学适应性试卷(含答案).pdf
- 2026年重庆市永川区中考化学质检试卷(含答案).pdf
- 2026年重庆市第一中学校中考化学全真模拟试卷(二)(含答案).pdf
- 安徽池州市第二中学等校2025-2026学年高一下学期期中物理试卷A(含答案).pdf
最近下载
- 郭硕鸿《电动力学》课后习题答案.pdf VIP
- 《1.10 表面涂色的正方体》课件 苏教版数学六年级上册.pptx VIP
- 信息社会与人工智能(山东大学)中国大学MOOC慕课 章节测验 客观题答案.pdf VIP
- 金属学与热处理原理崔忠圻第三版课后题全部答案.pdf VIP
- DeepSeek V4:下一代AI大模型技术范式深度解析.pptx VIP
- 无锡杰程PVD真空光学镀膜加工搬迁建设项目报告表.pdf VIP
- 2023年外交学院历年考研外交学真题.doc VIP
- 大直径PDC钻头扩孔钻进载荷变化规律及钻进参数优化.pdf
- 高标准农田建设工程进度计划与措施.docx VIP
- 医院劳务服务项目方案投标文件(技术标).doc
原创力文档

文档评论(0)