- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
OLAP在软件著作权登记数据分析中应用研究
OLAP在软件著作权登记数据分析中应用研究
摘要:数据仓库和OLAP技术已经大量应用在金融业和商业管理中并取得了良好的效果。如何从海量软件著作权登记数据中发现有用的信息,是软件版权登记主管部门迫切关心的问题,也是软件登记者和拥有者十分关注的问题。围绕这一问题创建了一个ETL(Extract-transform-load)工程用于从原始OLTP数据库中获取数据,并且构建适合OLAP分析的数据仓库,最后用OLAP多维分析思想实现了数据分析功能,为管理决策人员提供快捷、简单、直观的查询分析。
关键词:OLAP;OLTP;数据仓库;多维数据分析
中图分类号:TP311 文献标识码:A DOI: 10.3969/j.issn.1003-6970.2015.10.022
引言
自实行软件著作权登记以来,各大版权登记单位都累积了十多年的登记数据,这些数据中包含了大量的登记者和管理者关注的信息。传统的统计方法对这些数据不能进行有效的分析利用,如何对这些海量的登记数据进行有效分析得出对管理决策有用的结论,是版权登记主管部门和软件设计者拥有者迫切关心的问题。大量的历史数据反应出的信息,也可作为软件设计者和软件所有者制作软件寻找创意的重要依据。
OLAP技术近年来在各个行业都有应用,充分说明了OLAP分析海量数据的优越性和准确性,并且国际各大数据库公司也相继开发了用于OLAP分析的工具软件。在国内,OLAP技术也引起广大科研人员的兴趣。本文结合软件著作权登记系统中的大量数据,对OLAP技术进行了详细应用。
1 0LAP技术概述
OLAP是数据仓库的主要应用,并且已经用在很多商业和金融业中用以挖掘历史数据背后的知识。OLAP主要用于对大量数据的分析,OLTP(在线事务处理)主要是保存当前事务的数据到数据库中,底层数据库系统是OLAP与OLTP的数据源,数据仓库则构成了二者共同的基础,OLAP和OLTP关注的角度都有很大的不同。数据仓库、OLAP以及数据挖掘技术针对这类问题为管理人员提供了解决方案。数据仓库(data warehouse)是将联机事务处理累积的大量数据经过重新加工进行存储管理,并且可以进行数据分析和挖掘,数据库由大量的数据表组成,数据仓库则是由数据库中的数据和大量的索引,存储过程,视图等等组成。
OLAP主要是基于多个维度进行数据查询和分析的,达到决策支持的目的。OLAP能使分析人员管理人员从不同的角度对企业数据进行快速、一致和交互的存取。OLAP的多维操作方法有切片,切块,旋转和钻取,其中切片是基于某一维度进行数据展现,切块可以看作是多次切片的叠加,旋转是交换了行或者列。钻取分为上钻或下钻,上钻是得到汇总性数据,比如原结果是季度数据,上钻可以得到年内数据,下钻是得到更详细的数据。
2 0LAP实施方案选取
目前企业主要分两种方案应用OLAP:一是利用已有的OLAP 工具创建,二是利用开发工具根据用户关注的维度白行开发分析工具。这两种方案各有特色,第一种方案可以从现有的规则上创建和管理用于OLAP分析的数据库,由于采用著名数据库厂商的现有工具所以能够创建完善的DSS系统,缺点是不够灵活,需要用户熟练此类软件的一些操作,而且其英文界面不方便国内用户操作,另外还需重金购买。第二种方案因为功能有限,只能进行小型应用,但优点是可根据用户的实际需求定制,比较灵活。所以本文定制开发了适用于著作权数据分析的OLAP系统,底层数仓据库使用雪花型组织模式。本系统的整体设计结构如下图1所示:
3 系统结构设计
a)构建适合OLAP分析的数据仓库
本系统沿用了数据仓库中的ETL过程,但主要功能是完成对业务系统数据的抽取、清洗和装载,即ECL过程,并没有遇到转换过程。从原始OLTP数据库中抽取所需数据到数据仓库中以只读形式保存,抽取过程中对原操作数据库中的数据进行清洗。因为原始数据库中的数据已经是按照关系数据库的规则结构化存储,所以仅需要对某些字段进行清洗操作。本数据仓库的可扩展性实现方法是增量进行加载新的数据。对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。先从原数据库抽取所需数据,直接将抽取数据生成的文件装入数据仓库的操作型数据层,在数据仓库中尽可能少做转换以保证原始数据的原貌。因登记系统的登记量巨大,而且原登记系统用的是关系数据库组织数据,本系统考虑到ROLAP在处理关系数据库方面的优势和MOLAP处理多维数据的优势,所以采用HOLAP方式存储抽取的的数据。
b)维度表和事实表的连接
本文组织软件细节数据的组织形式如图2所示,由一个主信息表和六个维表组成
您可能关注的文档
- NGO小额信贷对农户借款决策借款额度影响因素实证分析.doc
- NGO组织文化及塑造研究.doc
- NGO组织模式下传统手工艺保护研究.doc
- NGSS中新模式.doc
- NHA与ICON治疗正畸引起牙釉质脱矿体外实验研究.doc
- NHibernate在实验室信息管理系统中应用研究.doc
- NHL文化产业运作给我们启示.doc
- NHN4200氨氮监测仪在泸天化废水排放监测中应用及改进.doc
- NHS管理和运作模式.doc
- NICE指南19岁以下孤独症识别诊断和管理.doc
- OLAP联机处理技术在空管自动化系统中应用.doc
- OLA基因在绵羊抗病育种中研究进展.doc
- OLC1在喉鳞状细胞癌中表达及其临床意义.doc
- OLED器件空穴传输层中TPBI空穴阻挡层应用研究.doc
- OLED技术及柔性OLED性能缺陷研究.doc
- OLYMPUSAU640全自动生化分析仪维护保养及故障排除.doc
- OMG美语网络走红现象对我国对外传播创新启示.doc
- Ommaya储液囊结合侧脑室外引流治疗脑室内出血临床研究.doc
- OMOM胶囊内镜对小肠出血性疾病诊断价值.doc
- On Problems and Strategies of Intensive Reading Teaching of College English论大学英语精读教学中存在问题及对策.doc
文档评论(0)