大数据时代下图书馆数据挖掘和情报分析研究.docVIP

下载本文档

2
0
约5.25千字
约 12页
2018-07-07 发布于福建
举报
版权申诉

大数据时代下图书馆数据挖掘和情报分析研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

大数据时代下图书馆数据挖掘和情报分析研究

大数据时代下图书馆数据挖掘和情报分析研究　　[摘要＼]全球信息迅速膨胀带来的数字资源的快速发展，使得有效利用大量结构化、半结构化和非结构化的复杂数据逐渐成为图书馆工作的主旋律。在这一背景下依托图书馆资源、海量的数字资源及各文献的引证关系等，国内出现了新一代知识发现系统。以中文发现系统为例，它通过挖掘各类数据与用户行为之间的立体关系，实现以下效果：发现知识、洞察全局、价值再生。这一系统具有以下功能：引文分析、学术源流、趋势分析、知识关联与生长方向分析、可视化和智能辅助。　　[关键词＼]大数据；数字化环境；数据挖掘；引证关系　　[中图分类号＼]G250 ＼[文献标识码＼]A ＼[文章编号＼]2095-3712（2014）25-0088-04 　　一、引言　　（一）大数据　　截止到2011年，全球信息总量已经突破1.8千万兆亿，并不断以惊人的速度膨胀变大，这意味着“大数据”时代已经降临。哈佛大学知名学者提出：“这是一场革命，庞大的数据资源使得各个领域开始了量化进程，无论学术界、商界还是政府，所有领域都将开始这种进程。”针对这样的一个变化，大数据时代最大的转变就是，放弃对因果关系的渴求，取而代之的是关注相关关系。也就是说只要知道“是什么”，而不需要知道“为什么”。这就颠覆了千百年来人类的思维惯例，对人类的认知和与世界交流的方式提出了全新的挑战。　　（二）大数据下图书馆服务模式的转变　　全球信息迅速膨胀带来的数字资源的快速发展，使得有效利用大量结构化、半结构化和非结构化的复杂数据逐渐成为图书馆工作的主旋律。随着数据爆炸时代的来临，以及网络数字化环境的日益成熟，读者迫切需要一个可以简捷、快速获得所有知识的理想平台。同时，图书馆作为一个面向大众的知识服务机构，不仅需要了解客户需要什么服务，更需要通过图书馆―用户的服务关系去挖掘正在发生什么、预测和分析将来会发生什么，以便图书馆为读者提供更好的服务模式并积极应对未知的危机及挑战。　　二、大数据时代下的数据挖掘和情报分析机理　　（一）知识挖掘　　引入先进的技术手段，如知识挖掘算法、索引规则等，对各类文献资源数据进行处理和分析，使得文献的揭示由表面信息深入到各类文献之间存在的复杂关系中，继而帮助用户发现潜藏在数据背后的信息。通过知识挖掘处理，展现给读者的文献资源不再是一个点对点的结果表示，而是揭示各信息资源关联关系的立体知识体系。深入分析用户需要的甚至用户潜在的知识需求，为其提供更加精准化的知识发现服务。　　（二）情报分析　　基于已有的结构化和非结构化数据的知识组织和表示，综合应用数据挖掘、学习和推理技术，得出文献资源的增减变动方向和变化趋势，实现自动化、智能化的深入分析，帮助用户获取具有动态性、知识性和前沿性的情报知识。情报分析的主要作用是通过设置人机交互接口与用户进行交互。用户可以通过一定的软件环境指导学术原始数据的采集、抽取和分析处理过程及查看分析结果，并应用可视化技术动态直观地展现海量信息资源中潜在的规律和发展趋势。　　（三）中文发现系统　　中文发现系统以各类结构化、半结构化和非结构化数据为底层基础，通过先进的数据仓储、数据挖掘及搜索引擎等技术手段，全面揭示馆藏内及馆藏以外的各种学术文献的应用、管理，并深入挖掘大量数据资源背后的信息，为用户和图书馆提供知识发现服务。　　图1 中文发现系统读者需要的知识往往大于图书馆或系统所能想到的范围，考虑到用户的这一实际需求，中文发现系统通过挖掘各类数据与用户行为之间的立体关系，实现以下效果：　　发现知识：通过系统平台、技术手段，深入分析图书馆员的工作与用户的搜索行为，对信息资源进行充分的挖掘、关联和升值，更加全面和深入地揭示资源和服务的整体性，使得信息的查找和定位更加细化和快捷，帮助读者发现所有所需资源。　　洞察全局：使用户感受到的文献信息资源是一个整体，不再是一个庞大而零散割裂的“信息孤岛”。最终形成一个完整的情报分析体系，帮助读者和文献单位建立文献信息的全局概念，全面掌握研究学习的趋势与内容。　　价值再生：深入挖掘各文献资源之间的立体关系，实现图书、期刊、学位论文、会议论文等资源之间互引的立体引证关系与趋势发展关系，分析挖掘大数据背后的潜藏信息，从而帮助读者发现潜在的知识需求与研究信息。　　三、中文发现系统功能案例分析　　（一）引文分析　　系统利用各种数学及统计学的方法进行比较、归纳、抽象、概括等，对图书、期刊、论文、著者等分析对象的引用和被引用现象进行分析。使用的方法有图论、模糊集合、数理统计等数学方法和逻辑思维方法，目的在于揭示文献所蕴含的情报特征和相关关系。　　引文分析可以帮助读者超越时间空间，跨学科组织文献，同传统的分类法和主题法截然不同，使文献有序化，有利于对文献由表及里地深入展开分析，更易