网上信息过滤代理的研究和实现.pdfVIP

  • 1
  • 0
  • 约6.83千字
  • 约 7页
  • 2017-08-14 发布于安徽
  • 举报
网上信息过滤代理的研究与实现 陈宝树 党齐民 (华东理工大学上海201511) 摘要随着网上信息的急剧膨胀,提高信忠搜索的精度,实现个性{七信患服:夸.方便用 户的信息查询j成为网上信息搜索的一个主要问题.本文提出了一种基于c/s结构的网上信息 过滤代理,并利用Java语言子以实现.收到了较好效果. 关键词代理信息搜索Java 1.引言 随着IntemeI的飞速发展,人们对网络的依赖性越来越大,希望通过互联网络获得所需 要的各种信息。为此,相继出现了各种网络搜索引擎。然而,随着网上信息的急剧膨胀,目 前的搜索引擎越来越难以为用户提供满意的服务,主要的局限性在于返回的搜索结果太多, 含有大量无关信息,精确度低,用户很难扒中找到自己真正需要的信息,以至于用户不得不 对搜索结果再进行大量人工筛选和过滤。为了提高信息搜索的精度,方便用户的信息查询. 实现个性化信息服务,本文提出了一种基于C店结构的网上信息过滤代理,井利用Java语 言予以实现.收到了较好效果: 2.系统总体结构 本系统以一个代理的角色,接受用户的查询请求事件。可同时共享多个搜索引擎的资 源库为用户提供有效的信息服务。当用户提出查询请求后,系统先将查询请求翻译成对应搜 索引擎的搜索语法.分别发出多个查询请求:当接收到各个HTTP响应后,根据知识库中的 用户模式和个·|生化知识,并运用综合过滤处理规则对这些中间结果进行综合过滤处理.以统 一形式将最终结果反馈给用户;当用户对最终查询结果进行必要的评价分析时,系统可通过 学习自动更新知识库,以进一步提高搜索精确度。该系统总体结构如图l所示。 图1系统总体结构图 3.知识库 知识库中保存了各用户的查询模式和有关的个性化信息。主要包括的基本知识为: 3.1用户信息:用于存放用户的基本信息以及用户的个性化搜索信息。具体包括: 用户信息模式 f UserID(用户标识号); Used(使用标志); Name(用户名); PasswordHashCode(密码的Hash值); Licerise(用户权限): AceessCount(访问次数): LastAecessTime(上次访问时间); SearchEngine(用户搜索引擎信息); Keywords(用户关键词信息); WebSire(用户网站信息); Classification(用户分类信息); …} 用户搜索记录模式(存放用户的搜索历史信息) f SearchlD(搜索标识号); UserlD(执行搜索的用户标识号); Time(搜索的时间); Content(搜索的内容(关键词)); …} 3.2搜索引擎知识:存放搜索引擎的基本信息。 搜索引擎知识模式 f EnginelD(搜索引擎标识号); Name(搜索引擎名称); WebAddr(网址); Grade(基本分值); UserGrade(统计出的用户分值); …} 3.3主分类知识:存放主分类信息a 主分类知识模式 f ClassID(分类标识号); Name(分类名称); WebSitelnfo(统计出的网站分值); 在本系统中.使用了“主分类”的概念。主分类是对用户查询的基本分类,这苎差妻 分类箍未引擎Yahoo的基本分类一致。但由于基本分类数量很少,无法照顾到每个用户的 210 { _ 7’爵一 硼藤鬣鞠瓤j蕊≥■■■—■。 不同需求.为此本系统提供了一个“用户分类”,即用户可以在主分类之下设定自己的分类, 并且还可以设定用户分类与主分类之间的相关权值。 在知识库中除了存放这些基本知识外.还存放了综合过

文档评论(0)

1亿VIP精品文档

相关文档