- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Web数据挖掘与图书馆个性化服务
近几年,高校数字图书馆的发展速度非常快,其数据类型和总量也显著提升,数字资源覆盖多个领域,如电子图书、电子期刊、多媒体数据、海量的数据库等,这些数字化资源的出现为用户查阅资料提供了方便,但由于数据信息量大,用户在查找资料的过程中很难找准目标定位,因而会花费较多时间,而数据挖掘技术在高校数字图书馆中的应用则可以在很大程度上解决该问题。 1数据挖掘与数字图书馆的概述11数据挖掘的概述所谓数据挖掘,指的就是将有价值的、感兴趣的信息从大量的文档中提取出来,通常来说,可将数据挖掘划分为三种类型,即结构挖掘、内容挖掘和使用记录挖掘。 其中,结构挖掘指的是从的链接关系或者组织体系中推导出相关知识,通过文档之间的相互关系,可以为用户提供文档内容之外的有价值数据信息,通过这些有价值信息,能够对页面加以排序,进而更好地发现其中的关键页面信息,整个结构挖掘过程需要用到算法以及算法。 内容挖掘指的是将相关知识从文档内容或描述中抽取出来,这项工作可被当作是基本搜索引擎所负责的工作的延伸,主要包括立足于数据库的挖掘以及立足于代理的挖掘两大部分。 从性质上看,内容挖掘属于文本挖掘的一种形式,其作用的对象大部分是文档的文本区域,文本挖掘涵盖针对搜索工具的查询结果所开展的分析、整理、归类等工作。 使用记录的挖掘主要针对的是日志以及使用数据,它能根据的访问记录直接定位到感兴趣的模式,日志的涵盖面非常广,主要包括服务器上与访问有关的各类日志文件,如代理日志、引用日志、访问日志等,其中涉及到用户的诸多访问信息,包括访问时间、访问途径、用户的地址、访问结果等。 12高校数字图书馆概述随着信息化、网络化、数字化时代的到来,人们在工作和学习过程中对数据信息的需求量也逐渐上升,信息资源的类型及其表现形式越来越丰富,比较常见的主要包括电子图书、期刊等,在这样的时代背景下,数字图书馆也逐渐出现,它是以传统图书馆为基础的一种新型信息系统,它的主要功能是可以对文本、图像、数据、声音等多样化的信息进行采集、分析和整理,彻底颠覆了以往图书馆中采用其他非数字化介质来进行存储的落后方法。 数字图书馆主要采用现代化的先进技术,把图书馆中的重要文献进行数字化存储,用户可以利用互联网在任意时间和空间查看信息,这就使图书馆的服务范围突破了时空限制,能为用户带来更多的方便,与传统的图书馆相比,数字图书馆具有多方面的优势,具体表现在以下几点1相同的数据信息可在同一时间被多个用户查看,这就有效避免了传统图书馆中纸质书本只能在同一时间为一个人提供服务的缺陷。 2数字图书馆的信息查询更加方便,它能为用户提供远程信息检索功能。 3数字图书馆的数据信息存储空间比较小,其存储的数据信息能得到有效保护,不易被破坏。 2数据挖掘在高校数字图书馆个性化服务中的应用21发现用户偏好,为其提供个性化的访问区域站点在设计的时候大多是采用的同一种分类形式,也就是同一个页面内的分页面往往是按照其类别来组织的,用户在对站点进行访问的时候,可在很大程度上反映出其偏好,一般来说,用户在访问某页面时停留的时间越长或查看的字数越多,就表明该用户对这一页面的内容越感兴趣,对于不感兴趣的页面,用户停留的时间通常都比较短。 对用户感兴趣程度进行计算一般采用的是收集用户浏览页面的时间信息及其途径等方式,这些信息能充分反映出该页面对用户的吸引力,进而便于系统按照用户的偏好,为之提供个性化的访问区域。 22识别高频率访问路径,提升图书馆资源的利用率利用数据挖掘技术,能对数字图书馆中的高频率访问路径以及相关页面的重要页面进行精确识别,从而将一些关键的新书信息和分类信息放在经常访问的路径或者页面之上,便于用户找到所需信息,进而达到提升图书利用效率的目标。 23使链接结构得到进一步优化,为用户提供便利数字挖掘在高校数字图书馆中的应用能促进链接结构的进一步优化,具体来说,主要表现在下列两个方面1经过挖掘,可以了解到用户所访问的页面之间的关联,进而在具有紧密关系的页面之间加强链接,使用户更加快速地找到所需信息。 2经过挖掘,可以精确地找到用户的期望位置,若遇到期望位置的访问次数比实际位置的访问次数更多的情况,则可以采取在实际位置与期望位置之间设立导航链接的方式来最大限度提升站点的优化效果。 3结语总而言之,数据挖掘与当代高校数字图书馆的建设息息相关,为了提高数字图书馆的服务质量,最大限度满足用户的个性化需求,就必须学会科学地利用数据挖掘技术,把握数据挖掘的类型及其特征,使其在发现用户兴趣爱好、识别高频率访问路径以及链接结构优化等方面发挥出应有的作用,让用户在访问数字图书馆的过程中可以快速寻找到所需信息,充分感受到图书馆的人性化服务。
您可能关注的文档
最近下载
- 2025年国家电网专业技术人员考试(计算机水平)历年参考题库含答案详解(5卷).docx VIP
- I公章制作及常用的公章规格.docx VIP
- 2025年秋招:农村商业银行题目及答案.doc VIP
- 《大学生职业生涯规划与就业指导(慕课版)》全套教学课件.pptx
- 叶黄素艾草护眼贴产品技术要求标准2023年.pdf VIP
- 第一二三单元 古诗文积累默写专项练 2023-2024学年统编版语文七年级上册.docx VIP
- 老年人心理照护:老年人死亡认知教育PPT教学课件.pptx VIP
- 《氟化氢气体检测报警器校准规范》编制说明.DOC VIP
- 工程竣工测量技术方案(3篇).docx VIP
- 2025年入团考试练习试题(100题)含答案.pdf VIP
原创力文档


文档评论(0)