- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Web挖掘在高职数字图书馆个性化服务系统中应用
Web挖掘在高职数字图书馆个性化服务系统中应用
【摘 要】在分析Web挖掘技术的内容与类型的基础上,探讨利用Web挖掘技术分析用户的需求信息,发现用户的兴趣模式,并将其应用于数字图书馆中,构建个性化服务模型,不仅实现了图书馆资源的优化,还能为用户带来全新的数字图书馆服务体验。
【关键词】Web挖掘 数字图书馆 个性化服务 高职院校
【中图分类号】 G 【文献标识码】 A
【文章编号】0450-9889(2015)03C-0092-03
随着计算机网络技术、多媒体技术等高新技术的出现和快速发展,转变了信息存取方式,图书馆向数字化演变已经成为大势所趋。高职院校图书馆作为学生了解国内外科研信息、查阅资料等获取知识的重要场所,建设数字化图书馆也是高职院校图书馆要进行的一项重要革新工作。
数字图书馆是将现代网络、通讯和计算机等技术应用于信息的收集、整理、组织和传递的新的模式和理念,本质是利用各种信息技术为用户提供更加便利的服务,提高信息的广度和深度,提升图书资源的使用效率,提高服务质量。正是基于这样的理念,数字图书馆的个性化服务才应运而生,数字图书馆的个性化服务是根据用户的个性化的需求,搜集、分析、加工和重组信息,从而提供相应的信息服务,让用户获得所需的信息内容,关键在于对人的需求与信息处理能力的有机结合,通过挖掘用户的需求、兴趣和偏好,建立用户需求模型,再利用信息技术整合加工信息,为用户提供与之需求相匹配的信息资源,并且引导用户检索利用信息。本文将探讨利用Web挖掘技术分析用户的需求信息,发现用户的兴趣模式,并将其应用于数字图书馆中,为高职院校学生用户提供全新的服务体验。
一、Web挖掘技术
Web挖掘技术是数据挖掘技术在Web环境下的应用,是从大量Web文档集合中提取潜在有用的信息和知识的过程。基本原理在于根据用户的需求提取数据,通过预处理精简数据,去除不相关的冗余数据,接着选择合适的数据挖掘方法分析数据,形成一种易于理解的数据模式呈现给用户,主要有以下三种数据类型。
(一)Web内容挖掘
Web内容挖掘是对Web页面的本信息、图像、多媒体信息等文本内容进行特征提取,采用的技术方法主要是对页面文本的分类和聚类,以从文档内容中抽取出知识,算法的思想如下:
通过上述方法能够将Web页面内容表示成一个个矢量,然后通过计算矢量之间的距离进行文本的分类和聚类。
(二)Web结构挖掘
Web结构挖掘是从利用WWW之间的组织结构和联接关系,对Web页面进行分类,从中推导知识。超文本链接丰富了Web页面上的信息,使得Web页面能够提供除文本内容以外的有用信息,通过利用这些信息,运用挖掘方法从而对页面进行排序,发现重要的页面。
一个重要的页面通常被认为被引的次数较高或者被重要的页面引用。设是一个Web页面,被引用的页面集合为,引用的页面集合为,则 表示页面的重要性,表达式为,其中为引用的页面,表示引用的页面的总数。因此,针对一个查询条件,首先将利用相似度函数查找个页面;其次,计算个页面的重要程度进行排名,计算公式为:,其中,,,表示相似函数。
(三)Web日志挖掘
Web日志挖掘是通过挖掘Web访问记录,如IP地址、访问时间、访问日期、请求的URL以及用户浏览器等,了解用户的行为模式,发现用户感兴趣的模式。在数字图书馆中,主要采用的技术有路径分析和关联规则分析,路径分析是通过分析用户最经常访问的路径,从而调整站点之间的结构;关联规则是分析用户访问的Web页面之间的关联关系,找到隐含的信息。
二、基于Web挖掘技术的数字图书馆个性化服务模型
(一)Web挖掘技术在高职院校数字图书馆个性化服务中的应用
数字图书馆个性化服务是根据不同用户所提出的需求,利用网络技术、人工智能技术等,自动检索、收集网络信息和图书馆数字信息,并结合用户的行为、习惯以及浏览历史等信息,对信息进行整合,然后将这些信息推送给用户的一种综合性服务。Web挖掘技术作为一项综合技术,能够获取、分析用户行为,能为数字图书馆提供重要的信息基础。
1.发现学生用户兴趣,建立个性化的访问空间
一般而言,学生用户在浏览数字图书馆的过程中,会对感兴趣的Web页面浏览时间较长,浏览的次数较多,而对不感兴趣的Web页面浏览时间较短,次数也较少,基于此,我们可以通过用户浏览历史的时间和次数,发现学生用户的兴趣,为其建立个性化的访问空间,有利于用户浏览阅读。
2.实现数字图书馆网站链接结构的优化
通过关联规则分析用户的Web访问记录,发现不同页面之间的相关性,对于增强相关系较高的页面之间的联系,方便用户使用。例如学生用户在查找文献的过程中,除了会关注该文献的参考文献以外,
文档评论(0)