- 3
- 0
- 约6.6万字
- 约 68页
- 2019-05-08 发布于上海
- 举报
Y
Y 60749£
面向_Ll=|户的信息过滤研究与实现
摘要
计算机技术的发展,尤其是Intemet和网络技术的发展,极大的推动着万维网 (World wide Web)的普及。www深刻地改变着人们的生活和思维方式,Internet 已经成为人们不可缺少的信息来源。然而Internet信息资源的高度无序性和不可管理 性却给信息的使用者带来了极大的困难。由于玑今的搜索引擎具有通用的性质,因此 很难满足不同背景、不同目的和不同时期用J’。·的查询请求。
用户的信息需求都具有个性化的特征,这些信息需求是相对稳定的、时间相对长 久的,然而会随着时问的变化而不断变化的。自然而然,用户期待着能够适应个性化 信息需求的信息服务软件的出现。
针对用广,个性化信息服务这个特定的需求,本文目标就是开发出一种能够更加准 确地获取Www上的信息资源的工具。本文主要思路是利用用户兴趣模型、用户背 景知识对信息(该信息来自于目前比较流行的搜索引擎)进行过滤,然后把过滤后的 信息提交给用户,再根据用户的牛目关反馈对用户兴趣模型进行修正以改进信息提供的 满意度。本文的主要工作有:①合作实现了一个原型系统;②采用最大概率算法,实 现对中文文本的切词;③提出了一种描述用户兴趣类的描述模式:把用户的兴趣描述 为一个”元组:C=(C,,Q, ,G);其中每个G表示用户的一个兴趣方向,Ci=(Ip,
厶,厶),其中1,={(f。,w。), ,(f。,w。))I。={(f.,w。), ,(f。,w。)}分别为用户兴趣 方向中相关网页集和不相关网页集的特征向量,我们分别称之为l吸引因子和排斥因 子:I。={(fl,w1), ,(z☆,Ⅵ))为用户的兴趣方向关键字向量,我们称之为查询。④ 利用向量空间模型(Vector Space Model)进行网页文档表示,然后利用线性过滤器对网
页文档进{J:过滤。⑤建立用户的相关反馈,对用户兴趣模型进行动态的修改和更新。
本文的创新点:主要提出了一种描述用户兴趣的描述模式,并在该基础上利用相 关反馈对其进行了修正和更新。进一步的研究工作有:第一,对于吸引因子、排斥因 子(厶,厶)的选取方法还可以尝试其它的’一些方法,这样有可能提高网页的过滤精 度;第二,用户兴趣修『F模型中的参数a,口,y作为用户兴趣学习率,还有待于进一
步的进行实验,使其更加的适应用户的兴趣变化曲线。
关键词:信息过滤、信息检索、用户兴趣模型、模型更新、个性化
索经作者、导师间惹
l曾叠文公帝
面向Hj户的信息过滤研究与实现Abstract
面向Hj户的信息过滤研究与实现
Abstract
Up tO now,the World Wide Web(www)grows into a large hyperlinked corpus with more than 800 million pages and 5600 million hyperlinks,The web contains a rich and dynamic collection of hyperlink information and Web page access and usage information,
providing rich sources for US.However,the information in Intemet is disorder,it’S a real challenge for US to make Intemet easier to use.Traditional information retrieval technologies satisfy users’S general needs—conlmon characteristics,the current Search Engine cannot satisfy users’specific need.
Because everybody has specific need which is relative unchanged but will be changed over time slowly,the personalized infomamion service will play an more and more impoaant role based on the user’s interest in the Internet.
Based on the user’S specific information service,we hope implement that can obtain information in Internet accurately.We fi
您可能关注的文档
- 科利华网络股份有限公司财务战略研究-企业管理专业毕业论文.docx
- 慢性髓系白血病相关PTP家族成员的表达谱芯片筛选和初步功能研究-内科血液病学专业毕业论文.docx
- 洛阳市中小学足球活动开展现状及发展对策研究-运动训练专业毕业论文.docx
- 科技进步对中国经济增长的贡献分析-管理科学与工程专业毕业论文.docx
- 考虑残余应力的主动脉弓血管壁的有限元分析-工程力学专业毕业论文.docx
- 面向中小企业的制造信息平台的研究-机械设计及理论专业毕业论文.docx
- 洛可可时期服装元素在现代女装中的运用-服装设计与创新专业毕业论文.docx
- 科技进步对中国经济增长的贡献研究-管理科学与工程专业毕业论文.docx
- 空调冷冻水系统的运行控制策略-供热、供燃气、通风及空调工程专业毕业论文.docx
- 科曼多家具有限公司竞争战略研究-工商管理专业毕业论文.docx
- 统编版2025年春季新版七年级下册历史 第21课 明清时期的科技与文化 教案.docx
- 雅安雨城法院书记员招聘考试真题库2025.docx
- 2026届安徽合肥市高考一模高考语文试卷试题(含答案详解).pdf
- 【专题研究】国内外城市更新研究的最新进展.pdf
- 【专题研究】老旧城区改造居民满意度影响因素研究——以遂宁市老旧城区改造为例.pdf
- 【专题研究】关于旧城空间改造理论与创意设计案例的几点思考.pdf
- 西藏拉萨市高三下学期期末物理备考重点详解.docx
- 泾县法院书记员招聘笔试真题2025.pdf
- 2026年春【苏教版】-六年级数学下册-面积的变化.pptx
- 2026年春【苏教版】-六年级数学下册-7.pptx
最近下载
- 病理性Q波课件.pptx VIP
- 电气控制与PLC应用技术全套课件.pptx VIP
- 穿越软硬突变地层盾构隧道管片及接头力学性能的多维度解析与工程应用.docx
- 第3课 “开元盛世”与唐朝经济的繁荣(同步教学课件)2025-2026学年七年级历史下册新授课课件.pptx VIP
- 《中国传统戏曲艺术》课件.ppt VIP
- 闽江特大桥主墩单壁钢吊箱围堰.doc VIP
- 第32讲_认定股东身份的基本规定、名义股东与实际出资人、股东的权利与义务概述、股东查阅权.pdf VIP
- 《老年社会工作》全套教学课件.pptx
- 矿山运输与提升:露天矿汽车运输PPT教学课件.pptx
- 管理学基础-第4版-张云河-1.2管理者认知.pptx VIP
原创力文档

文档评论(0)