面向用户的信息过滤研究与实现-计算机软件与理论专业毕业论文.docxVIP

  • 3
  • 0
  • 约6.6万字
  • 约 68页
  • 2019-05-08 发布于上海
  • 举报

面向用户的信息过滤研究与实现-计算机软件与理论专业毕业论文.docx

Y Y 60749£ 面向_Ll=|户的信息过滤研究与实现 摘要 计算机技术的发展,尤其是Intemet和网络技术的发展,极大的推动着万维网 (World wide Web)的普及。www深刻地改变着人们的生活和思维方式,Internet 已经成为人们不可缺少的信息来源。然而Internet信息资源的高度无序性和不可管理 性却给信息的使用者带来了极大的困难。由于玑今的搜索引擎具有通用的性质,因此 很难满足不同背景、不同目的和不同时期用J’。·的查询请求。 用户的信息需求都具有个性化的特征,这些信息需求是相对稳定的、时间相对长 久的,然而会随着时问的变化而不断变化的。自然而然,用户期待着能够适应个性化 信息需求的信息服务软件的出现。 针对用广,个性化信息服务这个特定的需求,本文目标就是开发出一种能够更加准 确地获取Www上的信息资源的工具。本文主要思路是利用用户兴趣模型、用户背 景知识对信息(该信息来自于目前比较流行的搜索引擎)进行过滤,然后把过滤后的 信息提交给用户,再根据用户的牛目关反馈对用户兴趣模型进行修正以改进信息提供的 满意度。本文的主要工作有:①合作实现了一个原型系统;②采用最大概率算法,实 现对中文文本的切词;③提出了一种描述用户兴趣类的描述模式:把用户的兴趣描述 为一个”元组:C=(C,,Q, ,G);其中每个G表示用户的一个兴趣方向,Ci=(Ip, 厶,厶),其中1,={(f。,w。), ,(f。,w。))I。={(f.,w。), ,(f。,w。)}分别为用户兴趣 方向中相关网页集和不相关网页集的特征向量,我们分别称之为l吸引因子和排斥因 子:I。={(fl,w1), ,(z☆,Ⅵ))为用户的兴趣方向关键字向量,我们称之为查询。④ 利用向量空间模型(Vector Space Model)进行网页文档表示,然后利用线性过滤器对网 页文档进{J:过滤。⑤建立用户的相关反馈,对用户兴趣模型进行动态的修改和更新。 本文的创新点:主要提出了一种描述用户兴趣的描述模式,并在该基础上利用相 关反馈对其进行了修正和更新。进一步的研究工作有:第一,对于吸引因子、排斥因 子(厶,厶)的选取方法还可以尝试其它的’一些方法,这样有可能提高网页的过滤精 度;第二,用户兴趣修『F模型中的参数a,口,y作为用户兴趣学习率,还有待于进一 步的进行实验,使其更加的适应用户的兴趣变化曲线。 关键词:信息过滤、信息检索、用户兴趣模型、模型更新、个性化 索经作者、导师间惹 l曾叠文公帝 面向Hj户的信息过滤研究与实现Abstract 面向Hj户的信息过滤研究与实现 Abstract Up tO now,the World Wide Web(www)grows into a large hyperlinked corpus with more than 800 million pages and 5600 million hyperlinks,The web contains a rich and dynamic collection of hyperlink information and Web page access and usage information, providing rich sources for US.However,the information in Intemet is disorder,it’S a real challenge for US to make Intemet easier to use.Traditional information retrieval technologies satisfy users’S general needs—conlmon characteristics,the current Search Engine cannot satisfy users’specific need. Because everybody has specific need which is relative unchanged but will be changed over time slowly,the personalized infomamion service will play an more and more impoaant role based on the user’s interest in the Internet. Based on the user’S specific information service,we hope implement that can obtain information in Internet accurately.We fi

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档