Web挖掘在高职数字图书馆个性化服务系统中应用.docVIP

下载本文档

2
0
约4千字
约 9页
2018-08-11 发布于福建
举报
版权申诉

Web挖掘在高职数字图书馆个性化服务系统中应用.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

Web挖掘在高职数字图书馆个性化服务系统中应用

Web挖掘在高职数字图书馆个性化服务系统中应用　　【摘要】在分析Web挖掘技术的内容与类型的基础上，探讨利用Web挖掘技术分析用户的需求信息，发现用户的兴趣模式，并将其应用于数字图书馆中，构建个性化服务模型，不仅实现了图书馆资源的优化，还能为用户带来全新的数字图书馆服务体验。　　【关键词】Web挖掘数字图书馆个性化服务高职院校　　【中图分类号】 G 【文献标识码】 A 　　【文章编号】0450-9889（2015）03C-0092-03 　　随着计算机网络技术、多媒体技术等高新技术的出现和快速发展，转变了信息存取方式，图书馆向数字化演变已经成为大势所趋。高职院校图书馆作为学生了解国内外科研信息、查阅资料等获取知识的重要场所，建设数字化图书馆也是高职院校图书馆要进行的一项重要革新工作。　　数字图书馆是将现代网络、通讯和计算机等技术应用于信息的收集、整理、组织和传递的新的模式和理念，本质是利用各种信息技术为用户提供更加便利的服务，提高信息的广度和深度，提升图书资源的使用效率，提高服务质量。正是基于这样的理念，数字图书馆的个性化服务才应运而生，数字图书馆的个性化服务是根据用户的个性化的需求，搜集、分析、加工和重组信息，从而提供相应的信息服务，让用户获得所需的信息内容，关键在于对人的需求与信息处理能力的有机结合，通过挖掘用户的需求、兴趣和偏好，建立用户需求模型，再利用信息技术整合加工信息，为用户提供与之需求相匹配的信息资源，并且引导用户检索利用信息。本文将探讨利用Web挖掘技术分析用户的需求信息，发现用户的兴趣模式，并将其应用于数字图书馆中，为高职院校学生用户提供全新的服务体验。　　一、Web挖掘技术　　Web挖掘技术是数据挖掘技术在Web环境下的应用，是从大量Web文档集合中提取潜在有用的信息和知识的过程。基本原理在于根据用户的需求提取数据，通过预处理精简数据，去除不相关的冗余数据，接着选择合适的数据挖掘方法分析数据，形成一种易于理解的数据模式呈现给用户，主要有以下三种数据类型。　　（一）Web内容挖掘　　Web内容挖掘是对Web页面的本信息、图像、多媒体信息等文本内容进行特征提取，采用的技术方法主要是对页面文本的分类和聚类，以从文档内容中抽取出知识，算法的思想如下：　　通过上述方法能够将Web页面内容表示成一个个矢量，然后通过计算矢量之间的距离进行文本的分类和聚类。　　（二）Web结构挖掘　　Web结构挖掘是从利用WWW之间的组织结构和联接关系，对Web页面进行分类，从中推导知识。超文本链接丰富了Web页面上的信息，使得Web页面能够提供除文本内容以外的有用信息，通过利用这些信息，运用挖掘方法从而对页面进行排序，发现重要的页面。　　一个重要的页面通常被认为被引的次数较高或者被重要的页面引用。设是一个Web页面，被引用的页面集合为，引用的页面集合为，则表示页面的重要性，表达式为，其中为引用的页面，表示引用的页面的总数。因此，针对一个查询条件，首先将利用相似度函数查找个页面；其次，计算个页面的重要程度进行排名，计算公式为：，其中，，，表示相似函数。　　（三）Web日志挖掘　　Web日志挖掘是通过挖掘Web访问记录，如IP地址、访问时间、访问日期、请求的URL以及用户浏览器等，了解用户的行为模式，发现用户感兴趣的模式。在数字图书馆中，主要采用的技术有路径分析和关联规则分析，路径分析是通过分析用户最经常访问的路径，从而调整站点之间的结构；关联规则是分析用户访问的Web页面之间的关联关系，找到隐含的信息。　　二、基于Web挖掘技术的数字图书馆个性化服务模型　　（一）Web挖掘技术在高职院校数字图书馆个性化服务中的应用　　数字图书馆个性化服务是根据不同用户所提出的需求，利用网络技术、人工智能技术等，自动检索、收集网络信息和图书馆数字信息，并结合用户的行为、习惯以及浏览历史等信息，对信息进行整合，然后将这些信息推送给用户的一种综合性服务。Web挖掘技术作为一项综合技术，能够获取、分析用户行为，能为数字图书馆提供重要的信息基础。　　1.发现学生用户兴趣，建立个性化的访问空间　　一般而言，学生用户在浏览数字图书馆的过程中，会对感兴趣的Web页面浏览时间较长，浏览的次数较多，而对不感兴趣的Web页面浏览时间较短，次数也较少，基于此，我们可以通过用户浏览历史的时间和次数，发现学生用户的兴趣，为其建立个性化的访问空间，有利于用户浏览阅读。　　2.实现数字图书馆网站链接结构的优化　　通过关联规则分析用户的Web访问记录，发现不同页面之间的相关性，对于增强相关系较高的页面之间的联系，方便用户使用。例如学生用户在查找文献的过程中，除了会关注该文献的参考文献以外，