- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅谈公路信息化中存储系统规划
浅谈公路信息化中存储系统规划
摘要:以高速公路收费系统为主体的信息化系统每天制造着大量的数据,有了充足的数据资源,面临的一个关键问题就是如何对海量数据进行存储与管理。本文提出了一种适用于计算机联网处理海量数据存储与管理的策略,并着重对该系统的基本构成、物料设计与逻辑设计进行了描述。
关键词:公路收费 海量数据 数据存储与数据管理
一、概况
在信息技术日新月异的今天,信息化工程建设已经深入到各行各业,许多发达国家的公路部门,办公自动化省、市、县三级已实现联网办公;也陆续上马了养护管理系路政管理系统、养路费征稽管理系统、通行费收费管理系统、财务管理系统等。而高速公路收费系统事实上成为公路信息化的中枢,一般包括若干个子系统,如车道系统、软件系统、CCTV系统、车辆检测系统,栏杆机控制系统、网络系统、照明系统、控制信号系统、供电系统等。这些系统每天制造着大量的数据,堪称海量,诱发着一个关键问题就是如何对海量数据进行存储和管理。
公路数据库中所采集和处理的数据量十分巨大,例如,一个信息中心的相关数据就达数百GB,而这仅仅是计算机联网系统所要采集和处理的一个部门的数据,如果加上路政、财务、大型工程建设等其他部门的数据,每年的处理数据量将以TB为单位进行计算。
对于高速公路收费系统中的海量数据,除了数据量大以外,其特点就是在数据相关性上不仅具有横向相关度,而且也具有纵向相关度。针对这种特点,本文提出并实现了一种计算机联网处理海量数据库存储系统,该系统采用了集群系统和SAN系统相结合的方式,先对横向无关的数据作了合理的分区,再对纵向相关的数据作了关联,使纵向相关的数据能够并行执行事务,从而在提高系统存储容量的同时,也提高了系统的查询速度。
二、存储系统规划
在海量数据的存储和管理方面,集群系统得到了广泛应用。根据海量数据存储和管理中处理器访问内存和磁盘方式的不同,可以将集群系统分为三种类型:共享内存式、共享硬盘式、非共享式。其中非共享式结构是支持并行数据库系统的最好结构,到目前???止,在非共享式系统上能够实现性能最优、吞吐量最大的并行数据库已经成为业界的共识。但由于共享内存式服务器在硬件上比较容易实现,因而在实际系统中集群系统一般采用共享内存式和非共享式结构相结合的方式,即非共享式结构的集群中各个结点是共享内存式结构的服务器,一般有两个以上的CPU。
为实现海量数据存储,还必须为集群系统提供足够的存储空间,一般的做法有两种:(1)在集群结点上挂接大容量本地硬盘。(2)使用SAN系统提供的海量存储空间。如果采用传统的挂接大容量本地硬盘的方式,尽管结果简单,但管理繁琐,且不易扩充;而SAN系统则有管理方便、扩充容易、能够实现透明逻辑等优点。
考虑到SAN存储系统具有很好的数据共享性,可扩展性和可靠性,故而推荐公路信息化采用SAN存储系统作为海量数据存储结构。集群计算机结点通过光纤通道卡直接连接到光纤存储网络上,确保了存储数据能够高速进行I/O。SAN存储系统将采用双控制器,有效提高存储系统的可靠性和数据的高可用性,通过预留出数据备份系统接口,安装分区模块系统和存储管理系统。同时,各集群结点共享磁盘阵列中存储的数据,结点本局负载动态地进行调整。
三、存储策略
1.逻辑结构设计:
在公路数据库系统中,由于采用非共享式结构,因而需要将SAN磁盘存储池划分成若干独立的区,集群中各个结点独享对应的区。例如系统由多个结点机组成,其中的SAN系统被分为若干个逻辑分区,每个分区绑定到一个集群结点上;此外,为保证不同部门数据的安全性和独立性,采集来的数据被设计成若干独立 表,或单独存储在一个分区上,或跨区存储在若干分区上,这种设计结构既保证了分区负载相对均衡,又保证了各个部门的数据独立性。
数据库采用分区技术可以大大增加所存储的数据容量。例如DB2表和表空间大小限制是建立在每个分区基础上的,因此在单机版DB2数据库中表的最大容量是1024GB(以64KB页面的大小)。使用多个逻辑分区则可允许用户通过增加分区数量来增大表的容量,比如把一个数据库分区成横跨4个结点,这种数据库系统就可以支持最大的(以64KB页面大小)的4096GB的表。
2.存储分配策略:
对于非共享式结构的并行数据库系统,数据表分区分配策略非常重要,良好的数据的分配策略应该使数据均匀的分布在各个分区上,并且方便数据重组,并且使得数据扩充时尽量不产生数据倾斜。目前常用的数据分配策略是Round-Robin(简称RR)方法、Range方法、Hash方法等。其中Hash方法既能够有效地支持大数据量工作,也能有效地支持划分属性上低选择性谓词的数据操作,由于在公路信息化系统中经常需要比对、统计、分析大量数据,因
您可能关注的文档
- 浅谈“1+1”模式在独立学院系级学生干部运用.doc
- 浅谈SNS社交网络繁荣背后隐患.doc
- 浅谈“中国梦”与大学生思想政治教育工作融合.doc
- 浅谈“两票”在电力安全生产工作使用中存在问题.doc
- 浅谈Web2.0时代情感营销.doc
- 浅谈“中药”老字号企业品牌视觉形象再设计.doc
- 浅谈“以县为主,校财局管”农村义务教育经费管理模式.doc
- 浅谈“十二五”期间我国商业银行转型发展方向.doc
- 浅谈“地沟油”综合利用.doc
- 浅谈“排除合理怀疑”对自侦案件证据收集影响及对策.doc
- 浙江省临海市白云高级中学2025届高三历史3月月考试题.doc
- 云南拾谷县第一中学2024_2025学年高二物理上学期10月月考试题.doc
- 2025版高考生物总复习第13讲基因的分离定律教案苏教版.doc
- 湖北省黄石实验高中2024_2025学年高一历史下学期期末考试模拟卷.doc
- 通史版2025版高考历史大一轮复习专题七近代化的曲折发展__中日甲午战争至五四运动前4第4讲从维新思想到新文化运动课后达标检测含解析新人教版.doc
- 2024年高考数学考试大纲解读专题04导数及其应用含解析文.doc
- 河南省许汝平九校联盟2024_2025学年高一语文上学期期末考试试题扫描版无答案.doc
- 江西省吉安市吉水县第二中学2024_2025学年高一历史上学期第二次月考试题.doc
- 北京市平谷区2025届高三政治一模考试试题含解析.doc
- 2025届中考物理第四讲物态变化专项复习测试无答案新人教版.docx
文档评论(0)