铁路运输统计分析系统的设计与实现.docVIP

铁路运输统计分析系统的设计与实现.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
铁路运输统计分析系统的设计与实现.doc

铁路运输统计分析系统的设计与实现   摘 要 建立基于数据仓库及OLAP分析服务技术的铁路运输统计分析系统可以更有效地实现跨平台数据集中、以及铁路运输统计信息分析决策支持,是铁路信息化建设的重要组成部分。本分析系统将不同时期的各种运输统计系统,自1998年南昌局建局后独立统计以来的数据做为源数据,通过提取、转化和加载完成数据清洗,转化为有效、完整、可用的数据仓库中的数据,为铁路运输生产的分析决策提供数据支持。采用Sybase IQ数据仓库,选择Microsoft Analysis Manager作为OLAP分析服务,生成多维数据集,通过Excel数据透视表作为前端展示工具,建成铁路运输统计分析系统,辅助企业运输生产决策。   关键词 交通运输 铁路运输 运输统计 ETL转换   中图分类号:TP311.52 文献标识码:A   1研究背景及目的   铁路局在自身发展过程中,积累了大量的客运、行包、货运等数据,为利用这些数据发掘有价值的信息,需要建立一个面向主题的、集成的、稳定的、不同时期的数据集合,即数据仓库。铁路运输统计分析系统采用这一技术解决了铁路局现有数据存储形式已经不能满足信息分析的问题,存储了大量的数据实现了原始数据的整理和挖掘。   传统的数据库应用系统多为OLTP联机事务处理,并不能很好地支持分析决策。而铁路现有的数据库系统正是OLTP联机事务处理型的数据库应用系统,在铁路运输生产市场化的今天,对运输生产的分析决策,市场预测,优化运输组织,OLAP联机分析处理越来越重要。现阶段传统信息系统与决策分析营养需求才能在技术差距,铁路运输企业内部各信息系统中,经过长期应用、分割、累积和沉淀了大量不同存储格式的数据,这是一笔宝贵的决策信息财富。   2系统的架构与流程   2.1系统架构   本系统采用“Sybase IQ数据仓库 + SQL server 分析服务 + Excel透视表分析展示”体系结构,构建分析系统应用。通过分析服务、借助分析展示工具,可以对存储在数据仓库中的分析指标,生成历史时间范畴内、各种线路上产生的、全部不同的到达与发送地区的、各类货物品类、各种级别的旅客列车、等等其他不同查询视角属性的统计分析指标变化情况。   本系统由四部分组成:分析数据源、数据仓库、分析服务器和分析服务工具、客户端分析展示工具。见图1。   图1 系统架构图   2.2系统流程与模块   根据客运精密统计智能分析系统的用户需求及业务流程,流程如图2,并将系统的功能划分为如下模块:   (1)事实表与维度表的ETL数据转换模块;   (2)创建多维数据集模块;   (3)创建Excel透视表模块。   图2 系统流程图   事实表与维度表的ETL数据转换模块:主要包含维度字典表、客票报表事实表、行包报表事实表、客票压缩事实表行包压缩事实表的清洗与转换,并将这些维度表和事实数据表导入到Sybasse IQ数据库。   创建多维数据集模块:多维数据集是联机分析处理 (OLAP) 中的主要对象,是一项可对数据仓库中的数据进行快速访问的技术。多维数据集是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。   创建Excel透视表模块:数据透视表是一种可用于OLAP分析的交互式动态表格,可以完成对大量数据快速汇总和快速查看不同列表的数据统计结果,并能打印或图形化统计结果,能多视角、多层次、快速便利的分析、组织数据。例如,可对统计结果建立列联表、计算平均数、计算百分比、计算标准差,建立新的数据子集等。在建立好数据透视表后,还可以重新安排数据透视表,以便从多视角、多层次查看数据。连接已创建好的OLAP多维数据集,创建用户需求的透视表。   3ETL设计   ETL是将业务系统中的数据经过抽取、清洗转换之后加载到数据仓库的过程。ETL是该项目中的重要环节。ETL的质量主要表现为正确性、完整性、一致性、有效性的等几个特性。影响ETL质量的原因很多,主要包括:业务系统不同时期之间的数据结构不一致,业务系统不同时期的业务过程不一致,业务系统不同时期的数据完整性不一致等。   ETL的主要方式有空值处理、规范数据格式处理、拆分数据处理、验证主外键处理等。   (1)空值处理可用两种方式,一是直接在初始化时赋一个初始值,二是更具条件赋予不同的值,如在本系统中客票压缩表中的部分运类取值为空,就在读取客票压缩表前将运类值先初始化为0,然后根据客票压缩表中的运类数值重新取值。   (2)规范数据格式处理。对于不同时期的业务系统中,数据源中的时间、数值、字符等数据进行规范化,确保数据格式一致性,如有的系统中ny这个字段的命名格式是data型,有的系统中是char

文档评论(0)

sis_lxf + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档