- 2
- 0
- 约小于1千字
- 约 8页
- 2017-08-20 发布于安徽
- 举报
科普搜索的研究与实现
吴晨生 刘彦君 张鲁冀 董晓晴
北京市科学技术情报所,北京,100876
摘要:本文综合应用主题搜索技术和深网信息集成技术,设计并实现了一个基于科
普领域的主题深度搜索引擎。文中介绍了系统的体系结构、主题信息采集策略以及所使
用的关键技术,并通过实验验证了网页分类器的高准确性,最后设计实验验证系统搜索效
果并对相关工作进行了比较分析。
关键词:深网;主题搜索引擎;主题分类机器人;网页分类器
现,科普领域击
f;}普领域信息
℃块存在于大耍
-类效果非常好的一
L理 论 (SVM)最初
:求的分割平面,使
的一。,■。展可能{
‘± o_T
乏。96%,准穆
‰ =94%,滩
胃千科普幸颢
¨C:,写—E~刀tJl■丌7I
民性我们使用瑷
蝈显,很大程度一
均顺排档文档组
盘一个Docume】
吉息搜索,具有较
.后可用于多种专
泵网的信息集成戈
失效所致的一系j
采用了Rocci
:分类技术中
0,主要指穿
g)正是在这一
,采用基于SVM
页结构分析 的i
原创力文档

文档评论(0)