- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘和图书馆用户资源分析研究
数据挖掘和图书馆用户资源分析研究
摘 要
人类利用图书馆产生信息活动时所表现出的最基础、最平常、最通用的一种关系,便是用户资源和图书馆之间的关系。从这种关系出发,分析嫁接起这一简单联系的规律,便是数据挖掘技术。本文认为对图书馆用户资源分析研究应以数据挖掘技术为逻辑起点,从云计算、信息共享、数据排查、智能搜索、大数据存储等对图书馆用户资源进行整合和建设。面对信息资源日益丰富的今天,数据挖掘技术对管理图书馆信息资源技术提供了巨大便利。
【关键词】数据挖掘 用户资源
数据挖掘,即数据系统中的信息发现。随着计算机技术,特别是云计算、大数据记忆技术的快速发展,传统的手动查找信息模式被大数据智能检索替代。数据挖掘技术广泛应用于市场、工业、金融行业、科学界、互联网行业以及医疗业。数据挖掘技术在图书馆的应用,可以将海量的用户资源进行聚类、关联、整合,可以对用户搜索记录、图书流通记录、用户借阅信息等数据进行精确预判,发现一些隐蔽的联系,为图书馆采购图书、淘汰文献资料提供科学建议,也可以为用户提供个性化订阅服务,创新用户服务模式,为图书馆建设整个信息网络提供有力支撑。
1 大数据下的图书馆用户资源特征
图书馆用户资源是通过数字技术进行组织和管理的:
(1)经过数据关联分析,把数据库中存在的两个或两个以上用户之间的相同性提取出来,提高支持度和说服力;
(2)把用户信息按照相似性归纳成几个类别,建立宏观概念,发现其间的相互关系;其次定义这些相互关系,概念产生以后,即等同于这些相互关系的整体信息,用于建构分类规则或者数据模型;其次利用以上数据找出变化规律,对此规律进行模型化处理,并由数据模型对未知信息进行预判;
(3)把用户资源进行时序排序,检索出高重复率的模型;
(4)?M行偏差比对,检查数据之中的异常情况。图书馆利用大量的用户访问信息获取用户兴趣,发现用户群体,为不同的群体定制信息,还可以建立一个共享信息平台,让不同用户建立网络交流。
1.1 数据量大并且分布更广
大数据形势下,图书馆可以获取的用户资源不仅限于用户个人信息和搜索记录,也包括档案、学术研究、教学模式、用户评价和反馈等,数据丰富。同时,数据分布广泛,在互联网时代,可从图书馆应用系统、数据系统记录以及各种网页、移动终端的信息获取,显示出用户资源的分散性。
1.2 数据内容多元化,形式灵活化
数据系统里的存储方式不同,服务器不同,系统开发平台不同,致使许多用户资源无法交流互换。图书馆用户资源有半模型化、模型化和非模型化之分。传统的图书馆用户资源中,用户只是图书资源的使用者,与图书馆之间只是点对点单线互动,用户之间不存在交流,而在大数据网络平台下,用户之间可以建立内容共享互动平台,使得用户资源的内容更加多元化。
2 图书馆用户资源利用
2.1 有助于利用数据挖掘技术建立用户资源图书馆
用户资源图书馆具备信息量大的特点,用户可获得各方各面的信息,且从服务的个性化和全方位化而言,图书馆可根据社会热点或用户需求定制服务。一方面,建立用户资源图书馆,使各类用户信息在同一界面统一呈现,方便用户的选择和检索。另一方面,利用数据挖掘技术建立的用户资源图书馆,服务器众多,具有较强的计算能力和存储能力,拥有较高的数据处理能力,能同时容纳多数用户。因数据量大所导致的硬件费用和后期运行费用剧增,可通过构建用户资源图书馆平台以及应用服务得到解决。为应付不断提高的用户资源存储方面的压为,目前亟需的就是投入大量资金以扩容存储设备,无疑,建立用户资源平台可以解决此问题。
2.2 加速图书馆资源的数字化
强大的互联网呈现功能和用户信息保存的可靠性功能,用户资源存储的复杂性问题可得到很好的解决。其次,数据挖掘技术对于资源整合方面具有优势,通过分布式的存储模式整合大量信息资源提供给用户检索。不同的数据之间的互相操作以及全方位的互联网服务得以实现,很好的解决了资源重复建设的问题。因此,利用数据挖掘使得图书馆资源数字化具备可行性。从这个意义上来看,资源的馆藏数字化将会加快发展,而不只是图书书目的剧增。
2.3 降低人力资源成本,使图书馆各类资源得以整合和优化
随着各类用户资源利用步伐的加快,加之依赖因特网的用户对服务的可行性和效率性要求更高,大量不同体系的服务器布置在机房,系统维护人员的压力也相应??大。通过数据挖掘技术,可有效进行资源整合和优化,无需通过人力进行。
2.4 有利于分析用户心理和提升用户体验
数据挖掘技术能够利用用户资源计算出用户模型,这是研究用户需求、偏好、行为的一种常规方式,一般认为用户模型是对用户在某段时间内相对稳定的信息需求的记录。用户模型反过来对获取用户资源有十分重要
原创力文档


文档评论(0)