- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图书管理中数据仓库和数据挖掘实现
图书管理中数据仓库和数据挖掘实现
【摘 要】随着数据库技术的不断发展,图书管理数据库中存储的数据量急剧增大,如何从这些数据中挖掘有用的信息为决策者提供管理支持非常重要。全文先分析了图书管理中数据仓库和数据挖掘的重要性,然后着重分析了如何构建图书数据仓库以及图书数据挖掘。
【关键词】图书管理;数据仓库;数据挖掘
一、数据仓库和数据挖掘对图书管理的重要性
图书管理现在基本上都实现了计算机的信息化管理,方便了图书入库出库,借出还入等业务。但是当前的图书管理及系统都比较缺乏分析处理能力,比如哪些图书需求量大?特别是高校有大量的借书群体。还有哪种服务方式读者更喜欢?如何对借阅超期的行为进行分析?目前在国内的图书管理中,这些业务都很难实现。而数据仓库和数据挖掘则可以满足上述需求,原因在于:(1)这种技术让图书信息结构化。在业务系统中,它将这些信息结构化并以关系数据库格式存放于不同子系统中,从这些数据中获得统计分析数据较容易。(2)通过系统减少了数据访问查询的工作量,同时提高了查询速度。(3)保留了历史数据,并可以实现全局查询。综上,将数据仓库技术和数据挖掘技术引入到图书馆管理中,不但可增强图书馆管理者的决策能力和水平,还可以大大提高信息资源的利用率,且对充分发挥文献信息资源的作用,对高校而言还可以提高其教学、科研水平。
二、图书数据仓库的构建
数据挖掘是基于数据仓库的,有效地数据仓库对提高数据挖掘的效率有重大意义。
1.数据仓库与数据挖掘简介
数据仓库(Data Warehouse)简称DW。它是集成的面向主题的数据库集合,可以用来支持决策,支持功能。其中每个数据单位都与时间相关。这些数据应该是良好定义的、一致的、不变的,并且支持数据分析、查询、报表生成和与长期积累的历史数据的对比。数据仓库系统并非一个简单由各种数据合并而成的超大型数据库,而是一种专为联机分析应用和决策支持系统(DDS)提供数据分析和决策工具的结构化数据环境。它涉及数据的抽取、转换、装载、数据存取、元数据管理、查询、报表、分析工具及相应的开发方法等。
数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘是一门交叉学科,它通过结合数据库技术、人工智能技术、数理统计、可视化技术、并行计算等,把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。
2.数据仓库构建
应用到图书管理中的数据仓库建立步骤是,首先要合理地设计维度和划分粒度,分析设计指标,确保进入数据仓库的数据量不会过大,又不影响分析系统的性能。然后要建立数据仓库的逻辑模型和物理模型。具体实现过程如下:
首先建立数据库表。主要有(数据库中字段名为英文,便于理解,这里用中文标识):
(1)当前图书表:图书编号,名称,在库数量,出版社,出版日期,作者。
(2)借出还入表:借阅单ID,借阅者编号,借书编号,借书日期,还书日期,超期天数,滞纳金。
(3)借阅者表:借阅者编号,姓名,性别,职业(院系),住址,联系电话,信箱。
(4) 采购信息表:采购单ID,供应商编号,采购日期,图书名称,出版社,出版日期,作者,采购数量,单价,总金额。
(5)丢失信息表:图书编号,借阅者编号,丢失日期,处罚措施,处罚日期。
(6)续借信息表:借阅者编号,借书编号,借阅日期,还书日期,续借日期,续还日期。
(7)供应商信息:供应商编号,名称,地址,联系电话,联系人。
在以上最基本的七个表中,图书编号,借阅者编号,供应商编号分别唯一区分图书信息,借阅者,供应商。图书采购回来之后,通过采购信息表转入到当前图书表,在转的过程中,通过贴标签扫描的方式采集到其图书编号,并将图书名称,出版日期,作者,出版社等信息带入,然后将在库信息改变成入库后的库存即可。 在此关系数据库的基础上设计数据仓库,采用星型模式,通过数据转换(DTS)创建可以存储多维数据集的多维数据库,读者借书还书的数据信息数据主维度,而图书信息,借阅者信息等是其扩展维度。在分析数据时并不是以单一的维度为基准,而是以多个维度为根据。我们将图书维度、借阅者维度、供应商维度、采购信息维度、超期维度整合在一起就构成一个多维数据集,即数据仓库。
其次是建立元数据。在定义各种元数据时,以一定的命名规则进行命名,并以不同主题分别存放于不同目录下。对元数据进行科学管理,有利于对数据仓库的管理和维护。
最后是数据转入。数据转换服务DTS的主要功能是保证数据在不同的数据库如Oracle,sql server,d
您可能关注的文档
最近下载
- 2025《几何画板在数学教学中的应用研究文献综述》1800字.docx VIP
- 湘美版高中美术绘画 奏响色彩的旋律(共28张PPT)(内嵌视频).pptx VIP
- 规范《DLT555-2004-气体绝缘金属封闭开关设备现场耐压及绝缘试验导则》.pdf VIP
- 2025巧用几何画板开拓数学思维作一个角等于已知角教学思考.docx VIP
- 标日初级第1课练习.doc VIP
- Unit4EatwellSectionA2a-2e英文版教案人教版(2024)七年级英语下册.docx
- 教学经验分享.ppt VIP
- 2025届高考数学复习备考策略课件.pptx VIP
- 2013年考研英语一真题解析.pdf VIP
- 第2课 教师节快乐(教学设计)2025二年级上册道德与法治 - 副本.docx
文档评论(0)