一种以Web语义挖掘的个性化信息推荐设计.docVIP

下载本文档

1
0
约3.19千字
约 5页
2018-04-06 发布于北京
举报
版权申诉

一种以Web语义挖掘的个性化信息推荐设计.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一种以Web语义挖掘的个性化信息推荐设计　　摘要：该文首先介绍了介绍Web知识挖掘的实现流程和数据挖掘的基本原理及方法，通过对Web知识的分析，引出基于Web挖掘的个性化信息推荐流程。然后研究了基于语义层次Web的个性化信息推荐的方法包括用户兴趣的感知方法、用于兴趣的捕获方法等，在此基础之上，利用导出语义层次的Web使用文档和生成个性化推荐的Web页面集，并详细介绍了如何在语义层次上分析Web使用文档，并利用定义权重的计算方法生成Web页面集的重要度等方法，并对Web个性化信息推荐进行了详细的论述。　　关键词：Web知识挖掘；语义挖掘；个性化信息推荐　　中图分类号：TP391文献标识码：A文章编号：1009-3044(2011)08-1731-03 　　1 绪论　　Web信息以计算机可识别的方式存储与互联网的某一个节点上，并且可以在任何需要的时候通过互联网传向其他节点。与其他环境下的信息相比，Web信息具有以下特点：　　1）Web信息量大　　2）Web信息非常复杂　　3）Web信息是动态的　　4）Web信息中的“垃圾”非常多　　Web信息的多样性决定了Web挖掘的多样性。根据处理对象的不同，可以将Web挖掘分为三类：Web内容挖掘、Web结构挖掘和Web使用挖掘。Web内容挖掘是指从Web文件的内容及其描述中获取有用信息的过程，可以用于Web页面特征提取、基于内容的Web页面聚类、Web页面之间内容的管理规则发现等；Web结构挖掘是从WWW的组织结构和链接中发现知识的过程，可用于Web页面分类，并由此获得有关不同Web页面之间相似度及关联规则的信息，并有助于发现权威Web站点；Web使用挖掘是从Web站点服务器日志中发现有用知识和模式的过程。Web站点服务器日志记录了Web用户的行为轨迹，分析这些数据可以帮助理解Web用户的行为，从而提供个性化信息服务。　　2 Web用户兴趣模型　　Web用户兴趣模型是产生个性化信息推荐集合的主要知识源，在个性化信息推荐中起到核心作用，其捕捉Web用户真实偏好的能力在很大程度上将决定个性化信息推荐的效果。目前研究比较多的方法是基于Web用户兴趣模型来发现用户的行为特征--项目评价矩阵的表示方法、基于向量空间模型的表示方法、基于本体的表示方法以及基于范例的表示方法等[2]。　　1）项目评价矩阵　　用该方法来发现用户的行为，并进行客观的评价。该矩阵是Web用户行为的抽象，也可以反映客户的兴趣。满足Web用户需求的对象是包含各种Web资源的项目，所以将Web用户兴趣模型表示为Web资源及其评价值的形式应该是最直观的。当然，在实际应用过程中，Web用户对Web资源的评价值还可以利用多种方法进行计算，并非一定南Web用户直接给出。　　2) 基于向量空间模型的表示方法　　基于向量空间模型的表示方法是：用户的Web访问行为当做是一些列的向量表示，在向量中，每一维代表用户访问Web时的特征词条以及在词条上增加的权重。在具体的实现过程中，首先需要将项目(Web资源)表示成n个特征词条及其权重形式，进而将Web用户兴趣模型表示为n维向量空间的形式。显然，相对于第一种方法而言，基于向量空间模型的表示方法以特征词条为基础描述Web用户兴趣，能够较深入地揭示Web用户兴趣。虽然这种方法适用范围较广，也是当前大多数系统中所采用的表示方法，但是将项目(Web资源)转化为n个特征词条及其权重形式，必将丢失一些重要信息，从而导致最终构建的Web兴趣模型存在不足[3]。　　3 基于Web挖掘的个性化信息推荐流程　　个性化信息推荐的实现需要以Web用户兴趣模型为基础产生面向特定Web用户的信息推荐集。显然，Web挖掘的功能之一就是找出大量看似无关的信息之间的联系和规律，从而构建Web用户兴趣模型。首先，Web站点服务器日志记录了Web用户的行为轨迹，Web使用挖掘能够从中发现有用的知识和模式。这些知识和模式描述了Web用户的一般行为规律，是构建Web用户兴趣模型的关键。其次，Web内容挖掘能够实现Web页面特征提取、基于内容的Web页面聚类、Web页面之间内容的关联规则发现，它们都可以用于构建Web用户兴趣模型。最后，Web结构挖掘可用于Web页面分类，并由此获得有关不同Web页面间相似度及关联度的信息，同样可以用于构建Web用户兴趣模型。此外，由于Internet传输协议HTTP的无状态性以及客户端和代理服务器端缓存的存在，Web站点服务器日志数据是非常粗糙的。此时，就需要利用Web结构挖掘帮助处理Web站点服务器日志数据，进而为Web使用挖掘和Web内容挖掘提供高质量的数据集合。据此分析，Web挖掘与个性化信息推荐的融合应该成为研究的重点。图1描述了基于We