- 3
- 0
- 约3.31万字
- 约 13页
- 2018-08-23 发布于河北
- 举报
利用层次模型实现P2P网络的全文检索推荐.doc
利用层次模型实现P2P网络的全文检索
摘 要:本文的研究对象是P2P搜索问题。P2P搜索算法的理想目标是:一方面能够达到IR(Information Retrieval)算法的搜索质量,另一方面能够保证搜索的可扩展性。然而,已有研究提出的搜索算法尚不能同时满足这两个条件,为此,本文从层次聚类的思路提出一种新的DHC算法。其主要过程是:首先将共享文件转化成向量样本,然后增量式地向层次树中添加样本,样本按照一定要求放置于合适的位置上。在物理层面上,层次树的节点分置于各个servent,通过servent通讯实现层次树的调整。搜索时,query发起节点首先路由到层次树的根节点,从根节点出发向下逐层搜索,通过比较query与各个下层节点的距离,选出合适的分支继续搜索。在层次树中,叶节点代表样本,当搜索到达叶节点时,满足要求的样本将被发送回初始节点。理论分析和初步的仿真试验表明,DHC算法具有较高的查全率,其搜索深度和更新代价与servent总数的对数成正比。由此可得,基于层次聚类的DHC算法既能达到IR算法的搜索质量,又具有搜索可扩展性,是一种有效的P2P搜索算法。
关键词:P2P搜索;可扩展性;分布式;层次聚类;内容索引
Using hierarchical model to harness full-text retrieval in peer-to-peer network
Abstract: Ideal content-based routing algorithm should not only provide IR algorithms’ effectiveness, but guarantee routing’s scalability. However, former works did not really achieve both aims. In this paper, we present a novel method named Distributed Hierarchical Clustering to address it. Firstly, files in vector-format are placed to appropriate position in Hierarchical Clustering Tree (HC-Tree). In physical network, HC-Tree nodes may be placed on different servents, and clustering is established by servents communicating. Working in a top-down fashion, a query will be sent from root to relevant sub-nodes. When it reaches leaf nodes which are responsible for files, routing is terminated. The physical addresses of those relevant files will be returned to original node. Results from theoretical analysis and simulations show that, under preservation of a stable recall, DHC is incrementally scalable, with lookup costs scaling logarithmically with the number of servents. In conclusion, DHC is an efficient p2p routing algorithm.
Key words: peer-to-peer routing, scalability, distributed, hierarchical clustering, content-based
1简介
近来,Peer-to-peer系统(简称P2P系统)在文件共享和信息搜索等方面得到了越来越多的应用,Morpheus ADDIN REFMGR.CITE RefmanCiteYear2003/YearRecNum14/RecNumIDTextMorpheus/IDTextMDL Ref_Type=Internet CommunicationRef_TypeInternet Communication/Ref_TypeRef_ID14/Ref_IDTitle_PrimaryMorpheus/Title_Prima
您可能关注的文档
- -----论建筑工程施工安全管理和控制推荐.doc
- 论企业品牌战略问题-管理类毕业论文推荐.doc
- 论企业品牌战略问题11页.doc
- 论危急情况下保险企业对公共关系的管理推荐.doc
- 论商业银行的内部控制的意义内容.doc
- 论坛营销四部曲,让帖子飞一会儿(推荐).doc
- 论建筑物区分所有权中业主共有权的保护13页.doc
- 论教育技术学的两种研究取向(推荐).doc
- 论文 公平的竞赛评卷系统精品模型.doc
- 论文 服务机器人的现状及其发展趋势8p.doc
- 统编版2025年春季新版七年级下册历史 第21课 明清时期的科技与文化 教案.docx
- 雅安雨城法院书记员招聘考试真题库2025.docx
- 2026届安徽合肥市高考一模高考语文试卷试题(含答案详解).pdf
- 【专题研究】国内外城市更新研究的最新进展.pdf
- 【专题研究】老旧城区改造居民满意度影响因素研究——以遂宁市老旧城区改造为例.pdf
- 【专题研究】关于旧城空间改造理论与创意设计案例的几点思考.pdf
- 西藏拉萨市高三下学期期末物理备考重点详解.docx
- 泾县法院书记员招聘笔试真题2025.pdf
- 2026年春【苏教版】-六年级数学下册-面积的变化.pptx
- 2026年春【苏教版】-六年级数学下册-7.pptx
最近下载
- A Guide to Modern Econometrics 2nd Ed Marno Verbeek 习题答案.pdf VIP
- 范本道路货物运输企业车辆新增、变更、补证、注销申请表.doc VIP
- 《信息技术大数据数据资产价值评估》.pptx VIP
- 肥料级硫酸铵的作用与用途.docx VIP
- 辽西~辽中500千伏断面加强工程.pdf
- 关于几乎差集.pdf VIP
- 新零售企业数据资产评估.pptx VIP
- 变质岩 第5讲 变质岩的结构与构造.ppt VIP
- 2025年四川省什邡市事业单位公开招聘考试职业能力倾向测验(D类)(中小学教师类)真题完整版.docx VIP
- TCVIA130-2023 视觉疲劳测试与评价方法 第 3 部分 电子纸可读性测试及评价方法.pdf VIP
原创力文档

文档评论(0)