个性化用户兴趣模型的研究.docVIP

下载本文档

3
0
约5.94千字
约 13页
2018-11-02 发布于广东
举报
版权申诉

个性化用户兴趣模型的研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

个性化用户兴趣模型的研究.doc

个性化用户兴趣模型的研宄随着人们对信息获取手段和效率提出越来越高的要求，传统互联网的服务模式正在逐渐向主动式、个性化、高效率的转变。个性化服务技术的出现在一定程度上解决了 Internet中信息海量增长与用户获取信息手段相对简单之间的矛盾。用户兴趣建模技术作为个性化服务的核心问题，主要研究如何有效地进行用户兴趣的表示、更新、存储以及计算。关键词：个性化;用户模型;数据挖掘 TP301 A : 1672?7800 (2011) 012?0029?03 张艳（1983-），女，江苏邳州人，硕士，南京陆军指挥学院助教，研究方向为数据挖掘。1 用户兴趣模型研宄现状 1.1用户兴趣模型的研究内容目前的检索系统多从检索模型和信息加工过程来提高检索的准确性，并没有给予用户更多的关注，特别是以网络搜索引擎为例，不同背景的用户使用相同的提问来查询，得到的结果没有区别，相同的用户在不同的时间做的相同的查询，得到的结果没有区别，使得用户不容易发现自己的最新兴趣，这主要的原因是，在这些服务系统中，没有考虑到用户信息的存在，也就是用户过去的行为和用户的历史数据。为了解决这个问题，有必要引入用户兴趣模型。用户模型的应用领域是广泛的，在信息检索过程中引入用户模型，有利于实现自适应检索，既提供一种个性化智能化的信息检索服务。通过对用户检索行为历史中的记录和学习，可对用户检索提问分析得更为准确，这实质上就是提高检索结果与用户需求之间的相关性，通过提高用户相关度来提高用户的满意度。同时，用户模型有助于预期定位用户的需求，进行主动服务。用户兴趣模型的定义为：用户兴趣模型是用来捕获用户需求及其兴趣点，并记录、管理用户兴趣，描述用户潜在的兴趣及需求的模型。 1.2研宄现状早期用户模型主要是用在自适应人机界面 (Adaptive human?Computer interface),同时也是信息过滤(I nformation Fj Ite ri ng)机制研兜的一个核心问题。用户界面是直接与用户交互的接口，通过与用户的交互，接收用户的行为，积累用户处理事务的经验，以应对用户出现的新的动作。用户模型是用于存储和管理用户行为历史，存储学习用户行为的知识和进行相关推导的知识功能的集合。信息过滤是研究的是面向个体进行信息过滤筛选，它关注用户的长线需求(在一段时间内为固定不变的需求)，提供与其相关的信息。用户描述文件还没有一个统一的标准，如 W3C( .省略)有两个涉及用户描述文件的标准： PICSjplatform for internet content selection)和 APPEL1.0(a P3Ppreference exchange language 1.0),PICS 是父母和老师用来控制孩子的浏览能力的，提供了过滤规则定义语言PICSRules.APPELl.O可定义用户感兴趣的站点和过滤规则，这些规则大部分是在PICSRules 的基础上发展起来的。此外，Netscape,Firefly和 VeriSign 曾向 W3C 的 P3P(platform for privacy preferences)工作组提交了一个 OPS(open profiling standard)草案，由于目前P3P版本不打算考虑如何进行数据传输，因此该草案被搁置一边，OPS描述了如何表示一个用户描述文件以及用户与Web站点交互的问题。文件可以用文件来组织，也可以用关系数据库或其它数据库来组织。目前有一些系统采用基于 XML 的 RDFjresource definition framework）来表达用户描述文件，并利用支持XML的数据库系统来存储用户描述文件。这样，不仅利用了 XML的优点，也保持了系统的性能。表1从用户描述文件创建的数据源和表达方式比较了几个典型的个性化服务系统。 1.3存在的问题通过大量的调研学习发现：首先，目前大多数个性化系统的用户兴趣模型都是基于内容进行用户兴趣挖掘的，偏重于用户浏览内容的学习和研宄，而对用户行为的分析研宄尚不充分，未能有效地利用用户行为来发现用户兴趣及过滤噪音。由此所构建的用户兴趣模型的客观性和准确性都受到了限制。其次，用户及文档特征的表示方法单一，通常将文档或用户当作一个“整体”进行描述，这样的特征表示方法缺乏层次性，表示粒度有限，难以真正体现“个性化”的初衷。再次，用户兴趣模型学习过程中所用的训练文档都被假设为用户“兴趣文档”，没有对其中的“非兴趣文档”加以区分，因此引入了许多个性化系统自身系统框架及算法难以过滤掉的噪音。表1典型的个性化服务系统的用户描述文件对比个性化服务系统数据源用户描述文件的表示方式