基于数据仓库高校图书馆管理设计与实现.docVIP

下载本文档

20
0
约3.08千字
约 8页
2018-05-15 发布于福建
举报
版权申诉

基于数据仓库高校图书馆管理设计与实现.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于数据仓库高校图书馆管理设计与实现

基于数据仓库高校图书馆管理设计与实现　　[摘要]目前高校图书馆管理过程中产生大量的数据，而应用数据仓库技术可以从中获得重要的决策信息。剖析高校图书馆管理系统的现状和存在的问题，设计实现一个数据仓库系统，包括事实表、维度表以及以借阅事实表为中心的数据仓库模型。指出利用OLAP技术进行数据分析，以期为图书馆和高校提供决策支持。　　[关键词]高校图书馆　图书馆管理　数据仓库　数据分析　　[分类号]G258 　　　　目前我国高校图书馆管理已经从手工操作转变为联机事务处理，在为读者和图书馆管理人员带来方便的同时也产生了大量的数据，但是从零散的数据中很难看出包含的潜在信息。将数据挖掘技术应用于图书馆管理系统，可以把产生的大量原始数据转化为有价值的知识，为管理人员提供决策支持信息。而进行数据挖掘的第一步即建立数据仓库。本文在剖析高校图书馆管理系统的现状和存在问题的基础上，设计实现了一个数据仓库系统，以期为图书馆和高校提供决策支持。　　　　1　高校图书馆管理数据仓库系统(ULM-DW)总体结构　　　　创建数据仓库的工作是在原有的数据库基础上进行的，因此要分析原有的数据库系统中所有数据，在原有系统基础上建立新的数据仓库，再选定主题，进行统计分析和数据挖掘。本文的数据仓库采用“数据驱动”的方法进行设计，其总体设计架构，见图1。　　　　数据仓库的主要数据来源于原有的图书馆管理系统、汇文系统、数字图书馆统计系统等，这些数据存放在两种类型的数据库中：SOL Service和Oracle。首先从原始数据库中提取相关数据，然后进行清洗和转换，进入到数据仓库中存储，数据仓库中的数据是各个系统的原始数据，如：读者借阅记录、购书记录等，没有经过任何级别的汇总，保证了数据仓库的最小粒度数据，有利于数据挖掘的应用。在数据仓库的基础上，分别进行数据分析，并展示给相关授权者使用，以辅助决策。　　　　2　数据仓库的设计　　　　数据仓库建立的过程实际上是从传统的以数据为中心的操作性系统结构转移到以数据仓库为中心的体系结构的过程。数据仓库设计的主要工作是业务流程结构设计、主题设计、粒度设计。下面以图书借阅为例，详细描述这些步骤。　　2.1ULMDW业务建模　　先以图书借阅为主题，进行业务流程分析，在分析已有数据库表结构的基础上，说明表之间的关系，从而为数据仓库的实现打下基础。图书馆图书借阅流程，如图2所示：　　　　2.2ULMDW主题设计　　主题设计是数据仓库的关键，针对高校图书馆管理的需求特点，提出读者、图书和图书借阅三个主题。其中以图书借阅为核心的主题设计，通过对图书借阅数据的分析，可以得到相应主题的分析结果，这些数据信息有助于做出决策。而读者和图书主题是进行辅助分析决策的相关主题，这些主题也反映了高校图书馆现行发展阶段中所关注的一些方面。　　　　2.3粒度设计　　在粒度设计中，应优先考虑为业务处理获取最原子型的信息而开发维度模型。为了查询能以最精确的方式对细节知识进行抽取，数据仓库往往要求在每个维度可能得到的最低粒度上对数据进行表示。通过上述分析该系统中的粒度都选取最底层的，这样便于决策者不断的向下观察细节数据。　　在ULMDW的业务数据库中收集的数据是最小粒度，如时间包含年、月、日、时、分，用户对数据颗粒度的要求的变化会影响到数据模型的设计。在本系统中最佳粒度的数据是图书借阅事务的单个分列项，为了确保得到最大限度的维度性和灵活性，所有讨论都将在这个粒度上展开。　　　　3　数据仓库系统实现　　　　ULMDW在设计时采用星型模型来表示多维概念模型，该模型包括事实表，事实表的每一个维度都有一个维表。事实表的每一个元组都包含有指向各个维表的外键和一些相应的测量数据。在实际的设计中，图书馆根据读者主题、图书借阅主题和图书主题的需要，建立事实表和维度表。然后，从各数据源中抽取数据，集成到数据仓库中。　　　　3.1事实表的设计　　事实表是星型模型的核心，内容可以分为两部分：键和详细指标。事实表通过键将各维度表组织起来，共同满足用户的查询需求，根据不同主题设定的逻辑模型，可有不同的事实表。　　在ULMDW的设计中，对图书借阅事实的描述构成了数据仓库的事实表，它包括的数据是从联机事务处理系统中获得的真实信息。面向不同的主题需建立不同的事实表，其中核心主题图书借阅的事实表包括：读者维表，图书维表编号，日期维表。　　　　3.2维度表的设计　　所谓维就是分析问题的角度，不同的决策人员会从不同的角度看待数据。图书借阅数据是多维的，对不同的决策要求，可以通过选取不同的维度来导航到相应的目的。例如，图书借阅往往按图书种类、借阅次数、读者院系、日期等查询有关信息