- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在图书采购中应用
数据挖掘技术在图书采购中应用
摘 要:数据挖掘技术是一种可以将隐藏在大量数据信息中的有用信息以规则、概念、规律以及模式等形式提取出来的技术。把数据挖掘技术应用到图书采购策略的制定工作中,可以在挖掘图书馆计算机管理系统潜力的同时,很好地提高管理水平和服务水平。
关键词:数据挖掘;图书采购;策略;SPSS
Data mining technology in book purchase application
Xu Yi
Dalian vocational technical college, Dalian, 116037, China
Abstract: Data mining technology is a kind of technology which can be hidden in the multitudinous data information of which the useful information to rules, concepts, rules and models and other forms were extracted. The application of data mining technology to the book procurement strategy development work in mining, computer management system of library potential while well improve the management level and the level of reader service.
Key words: data mining; book purchases; tactic; SPSS
在信息高速传播、知识飞速更新的今天,图书馆只有正确合理地进行图书采购,才能够更好地实现其“在最恰当的时机,将最合适的图书,提供给最需要的读者”的目标。采用目前流行的数据挖掘技术,可以很好地对图书馆读者实际借阅情况进行分析,从而得出能够正确指导图书采购策略制定的信息,以保证图书馆能够更好地为读者服务。
1 数据挖掘简介
数据挖掘是一门涉及人工智能、数理统计、数据库、可视化、并行计算等多领域的交叉性新兴学科。数据挖掘就是将隐藏在大量数据信息中的那些对用户有用的信息提取出来的过程,这些信息通常会以:规则、概念、规律以及模式等形式展现出来,而提取的过程往往要采用一些特殊手段的非平凡过程,即数据挖掘技术。提取出来的信息可以帮助决策者分析历史的和当前的数据,发现隐藏在其中的联系和规律,从而对未来可能发生的情况进行合理地判断和预测[1]。
2 基于数据挖掘的图书采购策略
描述式数据挖掘和预测式数据挖掘是数据挖掘技术的两种形式。描述式数据挖掘又称概念描述,是数据挖掘的最基本形式,以简明扼要的形式来描述给定的数据集,体现了数据的特??。我们使用特征化描述方式的数据挖掘方法,根据读者借书的历史记录,发现并描述读者的真正需求。实现特征化描述主要有准备数据、相关分析、归纳特征属性、表示和使用挖掘结果几个基本阶段[2]。
图1 流程图
2.1 准备数据
获得有关数据、对数据进行初步处理和准备。具体步骤如下:
(1)获取主要字段:读者类型、专业、书名、主题、编著者、出版社、出版时间、价格、索书号、条码等。
(2)整合数据归纳成库,保证相同字段的数据在类型格式上一致。
(3)拆分“主题”字段,限制1本书最多包含3个主题词,即3个主题字段,其他忽略。
(4)拆分合并后的数据库,按学科不同分成各学科的子库(这在数据挖掘过程中称为数据分组),对各个子库分别进行处理。
2.2 相关分析
对待挖掘数据库中的字段进行分析,剔除掉那些相关性不足的字段。具体步骤如下:
(1)选用恰当的方法对属性字段进行分析;
(2)将待挖掘数据库中的相关性不足字段剔除掉;
(3)整理保留的字段,主要有:读者类型、主题1、主题2、主题3、编著者、出版社。
2.3 归纳特征属性
根据实际情况,只进行单因素分析,即只计算比较单一属性值域读者需求的关联程度。
2.4 表示和使用结果
使用条形图、曲线图以及饼分图等图表形式将分析结果表现出来。用图书借阅次数来表示图书的人气系数,人气系数越高表明该类型的图书越受读者欢迎,计算公式为:
式中P为任一主题总的人气系数,m为主题在挖掘数据库中出现的次数,rj为主题的权系数,rj∈{3,2,1},Ki为借阅频率系数[3]。
3 数据挖掘
原创力文档


文档评论(0)