- 33
- 0
- 约2.3万字
- 约 5页
- 2017-09-18 发布于浙江
- 举报
第30卷第8期 计 算 机 应 用 研 究 V01.3ONo.8
2013年 8月 ApplicationResearchofComputers Aug.2013
基于分层结构保留的增量网络爬虫算法米
胡廉民h卫,张泽斌。,徐威迪 ,黄 翰 ,李 英岫
(1.乐山师范学院a.物理与 电子工程学院;b.数学与信息科学学院,四川 乐山614000;2.华南理工大学 a.计
算机科学与工程学院;b.软件学院,广州510006;3.Oracle甲骨文研究开发中心(深圳)有限公司,广东深圳
518075)
摘 要:为了提高 目前爬虫算法抓取结果的有效性,提出了一种 旨在获取有效信息的改进网络爬虫算法,主要
设计了信息的分层结构保留策略和URL过滤模式。在改进算法中,网络资源定位符被分层存储,在保留信息全
部拓扑关系的基础上,将交错复杂的URL网络系统从一个图结构变为一个层次
您可能关注的文档
- 基于参照依赖实验的公平偏好性质探究_来自中国情境下的实验证据.pdf
- 基于残差分析的自适应曲线拟合滤波算法.pdf
- 基于查询接口文本VSM的Deep+Web数据源分类.pdf
- 基于产排污系数的木材工业排污量估算及污染负荷研究.pdf
- 基于车辆任务可靠性的协同车辆路径问题.pdf
- 基于陈列柜边界条件的馆藏文物地震滑移响应试验.pdf
- 基于粗糙集理论的Web服务选择方法.pdf
- 基于电力线通信技术的健康监护系统设计.pdf
- 基于对称非负矩阵分解的人脸识别算法.pdf
- 基于多属性的移动终端安全接入网络认证协议.pdf
- 楚雄彝族自治州大姚县2025-2026学年第二学期四年级语文期末考试卷(部编版含答案).docx
- 超速面试题及详细答案.docx
- 红河哈尼族彝族自治州元阳县2025-2026学年第二学期二年级语文期末考试卷(部编版含答案).docx
- 景区服务应急预案优化方法简答试题库及答案.doc
- 车间主任面试题及详细答案.docx
- 景区服务质量评价未来体系构建方法简答试题库及答案.doc
- 广元市朝天区2025-2026学年第二学期三年级语文期末考试卷(部编版含答案).docx
- 车管岗位面试题及详细答案.docx
- 景区服务应急预案制定要点简答试题库及答案.doc
- 吉安市峡江县2025-2026学年第二学期六年级语文第七单元测试卷(部编版含答案).docx
原创力文档

文档评论(0)