- 5
- 0
- 约1.44万字
- 约 8页
- 2016-11-27 发布于重庆
- 举报
基于在線增量学习的自适应聚焦爬虫研究
本文由fatcat132006贡献
pdf文档可能在WAP端浏览体验不佳。建议您优先选择TXT,或下载源文件到本机查看。
第 26 卷第 5 期 2009 年 5 月
计算机应用与软件
Computer App lications and Softw are
基于在线增量学习的自适应聚焦爬虫研究
朱 婷
1 2
1, 2
滕桂法 陆 浩 张长利 曾大军
1
2
2
2
(河北农业大学信息科学与技术学院 河北 保定 071001)
(中科院自动化所复杂系统与智能科学实验室 北京 100190)
摘 要 在原始分类器聚焦爬虫的基础上设计并实现在线增量学习的自适应聚焦爬虫 。该聚焦爬虫包括一个基础网页分类器和 一个在线增量学习自适应链接分类器 。基础页面分类器根据领域知识对抓取到的页面内容主题相关性进行分类 。在线增量学习自 适应链接分类器能即时根据爬虫爬得网页和网页链接信息作出分类模型调整以更合理方式计算链接的主题相关度 。系统中链接排 序模块采用 Top icalRank主题相关度计算方法分析链接优先抓取顺序 。把基于增量学习的自适应聚焦爬虫应用到农业领域 ,实验结 果和分析证明在线增量学习的自适应聚
您可能关注的文档
最近下载
- SY∕T 0556-2018 快速开关盲板技术规范.docx VIP
- 国开电大本科《人文英语4》一平台机考翻译题题库[2026春期珍藏版].doc VIP
- SRE转型历程与可靠性工程实践.pptx VIP
- 行政人事部工作手册.pdf VIP
- SYT 5767-2016 原油管道添加降凝剂输送技术规范.docx VIP
- 小红书_2026年小红书居住趋势 (家)的100个适我注意提案.pdf
- 高中数学复习专题14 立体几何综合(学生版).docx VIP
- 恒大-行政人事管理制度手册1.pdf VIP
- 经济地理学知到智慧树期末考试答案题库2024年秋江西师范大学.docx VIP
- 22MR601 城市道路—交通标志和标线.pdf VIP
原创力文档

文档评论(0)