学校图书馆应用WEB数据挖掘构思.docVIP

下载本文档

4
0
约3.36千字
约 7页
2017-12-06 发布于福建
举报
版权申诉

学校图书馆应用WEB数据挖掘构思.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

学校图书馆应用WEB数据挖掘构思

学校图书馆应用WEB数据挖掘构思　　摘要：随着时代的高速发展，我们日常生活中获得的信息急速增长，如何在这众多的信息中快速有效地找到我们需要的信息是越来越值得我们关注的问题。在高校图书馆中，我们就可应用数据挖掘的技术手段对图书馆中的文献系统产生的大量数据及WEB信息进行统计和分工，从而提高信息的利用效率额，为图书馆的使用者提供更高效、更高水平、更具信息时代特征及更为个性化的图书馆现代化信息服务。为此，本文就从数据挖掘技术的简要介绍出发，为学校图书馆应用WEB数据挖掘提出简要构象。关键词：学校图书馆；数据挖掘；WEB数据挖掘 1 关于数据挖掘的简要介绍数据挖掘（Data Mining）在当今时代已与计算机科学有着密不可分的关系，它是数据库只是发现（Knowledge-Discovery in Databases，KD）中的一个重要步骤。具体来说就是指从大量的、不完善的、模糊的、随机的实际数据中自动搜索隐含在其中的潜在的具有特殊关系性（属于Association rule learning）的信息和知识的过程。其主要相关于计算机科学技术利用统计技术、关联规则、基于历史的分析MBR方法、聚集检测、连接分析、决策树和规则推理、神经元网络、遗传算法等手段帮助人们对数据库中的大量业务数据进行抽取、转换、分析和转换模型化处理，从而实现利用数据预测未来，帮助决策者进行针对性更强、更为准确的决策的目标。所谓数据挖掘就是从有一定容量的数据库中发现各种数据模型、概要和导出值的过程，总而言之数据挖掘也是一个归纳的过程。一直以来，数据归纳应用主要集中在金融、零售及电子商务等方面。而随着数据额挖掘技术的发展，近年来其应用范围也扩展到图书馆信息系统的处理上。并利用WEB信息挖掘，与信息检索、文献加工及数据库等实现了紧密结合。 2 学校图书馆的Web数据挖掘构思 2.1 WEB数据挖掘技术随着计算机时代的全面发展，在过去的几十年中Web以其不可比拟的优势发展成为了当今世界规模最大的公共数据源。其中，Web数据的挖掘即是指从Web超链接、网页内容和使用日志中探寻有用的信息。根据在挖掘过程中使用数据的不同，可将挖掘任务划分为主要的三大类：Web结构挖掘、Web内容挖掘和Web使用挖掘。而数据挖掘经常采用的技术就包括：统计技术、关联规则方法、基于历史的分析MBR方法、聚集检测、连接分析、决策树和规则推理、神经元网络、遗传算法等，各技术之间侧重点有所不同，笔者对其性能做出简要评比如下表： 2.2 数据挖掘在图书馆的应用作为一所高校信息汇聚的地方，以及学子们获得知识的重要阵地，图书馆一直是高校重点管理的地方。其文献资源、数字资源和网络资源不断增加，从数量巨大的数据中挖掘出对读者最有价值的信息资源，就成了目前图书馆管理的重要任务。因此，我们利用对于图书馆资源系统WEB的数据挖掘，为读者提取了其所需的显性及隐形知识，显著提高了图书馆资源的利用率及效率，有效提升学校图书馆知识管理服务的水平。 ⑴对图书馆文献管理集成系统的挖掘。图书馆要实现现代化管理，其中一项重要的任务就是对图书馆文献管理集成系统的数据挖掘。文献管理集成系统主要是对文献信息资源进行科学的管理、有效的开发并且最终实现资源的流通共享。在此过程中，我们可以利用数据挖掘的关联规则、决策树和聚类分析等方法对文献管理集成系统中的流通管理数据进行提取，着重注意其中的读者信息分类、书目信息以及相关借阅历史。从分析结果中，我们可以获得准确、科学的关于读者的借阅习惯及需求，以此来对照我们图书馆文献系统的现状，为图书馆的馆藏建设和图书推荐服务等工作提供科学依据。第一，馆藏建设。传统的图书馆馆藏建设都是由专门的工作人员一手包办的，虽然这个过程中也要参考许多专业建议，但不可否认这样的馆藏建设在很大程度上都具有主观性，不能真实反映广大读者的需求。同时我们也在思考，如何才能利用有限的资金让图书馆配备最优质的、利用率最高的文献配置？如能通过对馆内文献管理集成系统信息进行挖掘及分析研究，统计出各类，甚至各文献的借阅率等基本情况，就可以根据读者的需求有针对性地进行文献信息资源的补充。此外，对于图书馆中老化、过时的即时性文献也能进行清除。并且，对WEB数据的挖掘对于馆藏的合理布局也具有十分重要的指导意义。第二，图书推荐服务。对图书馆文献管理集成系统的数据进行挖掘，可以有效地了解该图书馆使用者的阅读习惯和研究方向等，从而进行有针对性的深入的相关主题推荐。从数据分析可对于时下大家感兴趣的主题进行介绍从而吸引更多的读者来进一步了解本馆的馆藏，甚至成为图书馆的常客。运用数据挖掘的关联规则对图书馆借阅数据进行处理，对相关的数据分析做出明确报告，还可得出各专业图书间的直接和潜在联系，真