一种以Web语义挖掘的个性化信息推荐设计.docVIP

一种以Web语义挖掘的个性化信息推荐设计.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种以Web语义挖掘的个性化信息推荐设计   摘要:该文首先介绍了介绍Web知识挖掘的实现流程和数据挖掘的基本原理及方法,通过对Web知识的分析,引出基于Web挖掘的个性化信息推荐流程。然后研究了基于语义层次Web的个性化信息推荐的方法包括用户兴趣的感知方法、用于兴趣的捕获方法等,在此基础之上,利用导出语义层次的Web使用文档和生成个性化推荐的Web页面集,并详细介绍了如何在语义层次上分析Web使用文档,并利用定义权重的计算方法生成Web页面集的重要度等方法,并对Web个性化信息推荐进行了详细的论述。   关键词:Web知识挖掘;语义挖掘;个性化信息推荐   中图分类号:TP391文献标识码:A文章编号:1009-3044(2011)08-1731-03   1 绪论   Web信息以计算机可识别的方式存储与互联网的某一个节点上,并且可以在任何需要的时候通过互联网传向其他节点。与其他环境下的信息相比,Web信息具有以下特点:   1)Web信息量大   2)Web信息非常复杂   3)Web信息是动态的   4)Web信息中的“垃圾”非常多   Web信息的多样性决定了Web挖掘的多样性。根据处理对象的不同,可以将Web挖掘分为三类:Web内容挖掘、Web结构挖掘和Web使用挖掘。Web内容挖掘是指从Web文件的内容及其描述中获取有用信息的过程,可以用于Web页面特征提取、基于内容的Web页面聚类、Web页面之间内容的管理规则发现等;Web结构挖掘是从WWW的组织结构和链接中发现知识的过程,可用于Web页面分类,并由此获得有关不同Web页面之间相似度及关联规则的信息,并有助于发现权威Web站点;Web使用挖掘是从Web站点服务器日志中发现有用知识和模式的过程。Web站点服务器日志记录了Web用户的行为轨迹,分析这些数据可以帮助理解Web用户的行为,从而提供个性化信息服务。   2 Web用户兴趣模型   Web用户兴趣模型是产生个性化信息推荐集合的主要知识源,在个性化信息推荐中起到核心作用,其捕捉Web用户真实偏好的能力在很大程度上将决定个性化信息推荐的效果。目前研究比较多的方法是基于Web用户兴趣模型来发现用户的行为特征--项目评价矩阵的表示方法、基于向量空间模型的表示方法、基于本体的表示方法以及基于范例的表示方法等[2]。   1)项目评价矩阵   用该方法来发现用户的行为,并进行客观的评价。该矩阵是Web用户行为的抽象,也可以反映客户的兴趣。满足Web用户需求的对象是包含各种Web资源的项目,所以将Web用户兴趣模型表示为Web资源及其评价值的形式应该是最直观的。当然,在实际应用过程中,Web用户对Web资源的评价值还可以利用多种方法进行计算,并非一定南Web用户直接给出。   2) 基于向量空间模型的表示方法   基于向量空间模型的表示方法是:用户的Web访问行为当做是一些列的向量表示,在向量中,每一维代表用户访问Web时的特征词条以及在词条上增加的权重。在具体的实现过程中,首先需要将项目(Web资源)表示成n个特征词条及其权重形式,进而将Web用户兴趣模型表示为n维向量空间的形式。显然,相对于第一种方法而言,基于向量空间模型的表示方法以特征词条为基础描述Web用户兴趣,能够较深入地揭示Web用户兴趣。虽然这种方法适用范围较广,也是当前大多数系统中所采用的表示方法,但是将项目(Web资源)转化为n个特征词条及其权重形式,必将丢失一些重要信息,从而导致最终构建的Web兴趣模型存在不足[3]。   3 基于Web挖掘的个性化信息推荐流程   个性化信息推荐的实现需要以Web用户兴趣模型为基础产生面向特定Web用户的信息推荐集。显然,Web挖掘的功能之一就是找出大量看似无关的信息之间的联系和规律,从而构建Web用户兴趣模型。首先,Web站点服务器日志记录了Web用户的行为轨迹,Web使用挖掘能够从中发现有用的知识和模式。这些知识和模式描述了Web用户的一般行为规律,是构建Web用户兴趣模型的关键。其次,Web内容挖掘能够实现Web页面特征提取、基于内容的Web页面聚类、Web页面之间内容的关联规则发现,它们都可以用于构建Web用户兴趣模型。最后,Web结构挖掘可用于Web页面分类,并由此获得有关不同Web页面间相似度及关联度的信息,同样可以用于构建Web用户兴趣模型。此外,由于Internet传输协议HTTP的无状态性以及客户端和代理服务器端缓存的存在,Web站点服务器日志数据是非常粗糙的。此时,就需要利用Web结构挖掘帮助处理Web站点服务器日志数据,进而为Web使用挖掘和Web内容挖掘提供高质量的数据集合。据此分析,Web挖掘与个性化信息推荐的融合应该成为研究的重点。图1描述了基于We

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档