- 1
- 0
- 约6.83千字
- 约 7页
- 2017-08-14 发布于安徽
- 举报
网上信息过滤代理的研究与实现
陈宝树 党齐民
(华东理工大学上海201511)
摘要随着网上信息的急剧膨胀,提高信忠搜索的精度,实现个性{七信患服:夸.方便用
户的信息查询j成为网上信息搜索的一个主要问题.本文提出了一种基于c/s结构的网上信息
过滤代理,并利用Java语言子以实现.收到了较好效果.
关键词代理信息搜索Java
1.引言
随着IntemeI的飞速发展,人们对网络的依赖性越来越大,希望通过互联网络获得所需
要的各种信息。为此,相继出现了各种网络搜索引擎。然而,随着网上信息的急剧膨胀,目
前的搜索引擎越来越难以为用户提供满意的服务,主要的局限性在于返回的搜索结果太多,
含有大量无关信息,精确度低,用户很难扒中找到自己真正需要的信息,以至于用户不得不
对搜索结果再进行大量人工筛选和过滤。为了提高信息搜索的精度,方便用户的信息查询.
实现个性化信息服务,本文提出了一种基于C店结构的网上信息过滤代理,井利用Java语
言予以实现.收到了较好效果:
2.系统总体结构
本系统以一个代理的角色,接受用户的查询请求事件。可同时共享多个搜索引擎的资
源库为用户提供有效的信息服务。当用户提出查询请求后,系统先将查询请求翻译成对应搜
索引擎的搜索语法.分别发出多个查询请求:当接收到各个HTTP响应后,根据知识库中的
用户模式和个·|生化知识,并运用综合过滤处理规则对这些中间结果进行综合过滤处理.以统
一形式将最终结果反馈给用户;当用户对最终查询结果进行必要的评价分析时,系统可通过
学习自动更新知识库,以进一步提高搜索精确度。该系统总体结构如图l所示。
图1系统总体结构图
3.知识库
知识库中保存了各用户的查询模式和有关的个性化信息。主要包括的基本知识为:
3.1用户信息:用于存放用户的基本信息以及用户的个性化搜索信息。具体包括:
用户信息模式
f UserID(用户标识号);
Used(使用标志);
Name(用户名);
PasswordHashCode(密码的Hash值);
Licerise(用户权限):
AceessCount(访问次数):
LastAecessTime(上次访问时间);
SearchEngine(用户搜索引擎信息);
Keywords(用户关键词信息);
WebSire(用户网站信息);
Classification(用户分类信息);
…}
用户搜索记录模式(存放用户的搜索历史信息)
f SearchlD(搜索标识号);
UserlD(执行搜索的用户标识号);
Time(搜索的时间);
Content(搜索的内容(关键词));
…}
3.2搜索引擎知识:存放搜索引擎的基本信息。
搜索引擎知识模式
f EnginelD(搜索引擎标识号);
Name(搜索引擎名称);
WebAddr(网址);
Grade(基本分值);
UserGrade(统计出的用户分值);
…}
3.3主分类知识:存放主分类信息a
主分类知识模式
f ClassID(分类标识号);
Name(分类名称);
WebSitelnfo(统计出的网站分值);
在本系统中.使用了“主分类”的概念。主分类是对用户查询的基本分类,这苎差妻
分类箍未引擎Yahoo的基本分类一致。但由于基本分类数量很少,无法照顾到每个用户的
210
{
_ 7’爵一 硼藤鬣鞠瓤j蕊≥■■■—■。
不同需求.为此本系统提供了一个“用户分类”,即用户可以在主分类之下设定自己的分类,
并且还可以设定用户分类与主分类之间的相关权值。
在知识库中除了存放这些基本知识外.还存放了综合过
原创力文档

文档评论(0)