基于数据仓库的广东省高速公路一张网过渡期通行数据及异常分析系统.docVIP

基于数据仓库的广东省高速公路一张网过渡期通行数据及异常分析系统.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数据仓库的广东省高速公路一张网过渡期通行数据及异常分析系统

基于数据仓库星形模式的广东省高速公路一张网资金结算情况分析系统 马根峰 (广东联合电子服务股份有限公司 广州 510300) 摘要 星形模式是基于关系数据库的数据仓库中的一个著名概念,由于星形连接模式的设计思想能够满足人们从不同观察角度(维)分析数据的需求,所以在基于关系数据库的数据仓库的设计中广泛地使用了星形模式。本文主要介绍《广东省高速公路一张网资金结算情况分析系统》中的数据仓库技术。 关键词 数据仓库;星形模式;维度 1 数据仓库的特点 数据仓库技术是用以更好地支持企业或组织的决策分析处理的,面向主题的,集成的,不可更新的、随时间不断变化的数据集合。它通过将数据按照不同的综合程度(即粒度)来组织,以满足不同分析的需要。 本文主要介绍一下《广东省高速公路一张网资金结算情况分析系统》中如何使用数据仓库技术来实现“异常流水”与其修改量分析与“流水上传与拆分” 分析这两个主题。 2 星形模式 星形模式是基于关系数据库的数据仓库中的一个著名概念,由于星形连接模式的设计思想能够满足人们从不同观察角度(维)分析数据的需求,加上数据仓库通常用来回答综合性的问题,所以在基于关系数据库的数据仓库的设计中广泛地使用了星形模式,如电信运营商中普遍进行的话务总体分析。 3 系统中的数据仓库设计 3.1 广东联合电子结算中心操作型环境 DB2数据库服务器下的数据组织情况 在广东联合电子结算中心, “异常流水”、“流水拆分”、“流水上传”有关的关系模式 粤通卡精确拆分结果明细表 tb_cardaccuratesplitresult (流水号,工班, 出口路段…, 收入路段) 现金精确拆分结果明细表 tb_cashaccuratesplitresult (流水号,工班, 出口路段…, 收入路段) 流水非精确拆分记录表 tb_inaccuratesplitrecord (流水号,工班, 出口路段…, 收入路段) 拆分流水异常记录表 tb_outlistspliterrorgb(流水号,工班,出口路段, …, 错误类型代码) 拆分流水异常记录历史表 tb_outlistspliterrorgb_his(流水号,工班,出口路段, …, 错误类型代码) 流水异常记录表 tb_outlisterrorgb(流水号,工班,出口路段, …, 错误类型代码) 流水异常记录历史表 tb_outlisterrorgb_his(流水号,工班,出口路段, …, 错误类型代码) 出口流水表 tb_outlistgb (流水号,工班,出口路段, …, 上传时间) 3.2 系统的中数据仓库设计 考虑到篇幅,各步骤经过简化如下: 概念模型设计 逻辑模型设计 数据仓库生成 3.2.1概念模型设计中的界定系统边界 在广东电信公话中心,管理者最迫切进行的分析主要有: 各高速公路路段公司不同工班的流水上传、流水拆分。 分析各个高速公路路段公司上传的异常流水(包含异常及拆分异常)、及其修改的情况; 要进行以上的分析,所需数据应包括: 分析各个高速公路路段公司在一段周期内的流水上传、拆分、异常总量、异常修改情况。 分析各个高速公路路段公司上传的异常流水(包含异常及拆分异常)、及上传的异常的流水(包含异常及拆分异常)流水的修改情况; 各个高速公路路段公司及他们的软件开发商 广东省高速公路所有的路段信息; 3.2.2 逻辑模型设计 因为细节级数据太大,数据仓库又建立在本人的PC机MS SQL SERVER 服务器上,加之迫于分析任务提交时间的压力,故本数据仓库中不再涉及细节级数据表的设计、数据挖掘。 关系模式定义: ok_xiugai (LISTNO, UPLOADTIME, OUTROADNO, SQUADDATE, ERRCODE, ERRMSG…) no_xiugai (LISTNO, UPLOADTIME, OUTROADNO, SQUADDATE, ERRCODE, ERRMSG…) upload_split(路段编码, 路段名称, 工班, 上传流水数量, 拆分流水数量…) kaifa (roadno, kaifa_name) tb_road(areano,roadno,roadname,…) 3.2.3 数据仓库数据生成 数据仓库中数据的生成包括操作型环境数据的挖掘和数据仓库中数据的生成这两部分的内容。在这一步里所要做的工作是接口编程,以实现将操作型环境下的数据装载进入数据仓库环境。 4 数据仓库的数据导出与展现 4.1 万能数据库查询分析器 万能数据库查询分析器,中文版本《DB 查询分析器》、英文

文档评论(0)

liudao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档