- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于大数据智能交通分析系统设计与实现
基于大数据智能交通分析系统设计与实现
摘要:随着社会经济的进步和交通运输业的快速发展,面对快速增长的城市道路交通数据,论文提出了基于Hadoop的智能交通分析系统设计方案,论文采用HBase分布式数据库存储城市道路静态RDF数据,采用Hive数据仓库存储城市道路交通数据,采用MapReduce编程模型对海量、异构城市道路交通数据进行分析,最后通过原型系统对整体方案进行验证。
关键词:交通大数据;Hadoop框架;智能交通
中图分类号: TP311 文献标识码:A 文章编号:1009-3044(2015)36-0044-03
Abstract: With the progress of social economy and the rapid development of transportation industry, in the face of the rapid growth of urban road traffic data, the paper puts forward the design scheme of intelligent traffic analysis platform based on Hadoop, the paper adopts HBase distributed database storage static RDF data on urban road traffic data, the paper adopts the Hive data warehouse storage urban road traffic data, using MapReduce programming model to analyze massive, heterogeneous urban road traffic data, finally, using the prototype system to the overall plan for validation.
Key words: traffic big data; the Hadoop framework; intelligent transportation
随着经济发展和人们生活水平的提高,城市汽车数量呈快速增长趋势,交通事故、交通拥堵等都对城市道路交通造成很大负担。在大数据时代,城市道路交通数据也呈指数级增长,面对其多源、异构、数量巨大等特点,如何快速高效进行数据分析,并将分析结果充分利用,从而提高城市交通运行效率是城市交通亟待解决的一大难题[1]。本文在分析交通大数据特点和当前大数据技术基础上,基于Hadoop相关组件和计算模型进行整体架构设计和应用响应流程设计,最终实现了对海量多源异构交通大数据的快速高效处理。
1系统设计
1.1交通大数据特点及其面临的问题
交通数据主要包括交通领域的道路信息、车辆信息等,通常将这些数据分为静态数据和动态数据。静态数据包括道路信息数据、道路设施数据、停车场数据等;动态数据包括如线圈设备、视频设备等采集到的交通信息数据。通过总结,可得出交通大数据主要具有以下特征:多源性、多维性、海量性、动态性和异构性[2]。对于静态数据来说,其主要是结构化数据,相比动态数据,其数量较小,且相对固定,但因数据采集机构和设备的差异,造成其具有较大的语义异构性,因此本系统引入本体模型对静态数据进行处理,解决语义异构问题;对于动态数据来说,则因为交通运输的快速发展以及大数据时代对数据需求的不断提高,使其具有更强的多源异构性,并且动态数据体量巨大,如何存储动态数据以及满足快速查询和计算的需求,是目前交通大数据面临的主要问题[3]。对静态数据本体,需要通过RDF三元组来表示,为了满足存储稳定、快速查询和方便扩展等特点,引入Hadoop框架的HBase组件进行存储;对动态数据,由于其体量巨大,且具有多源异构的特点,同时结合语义网技术,引入Hadoop框架的Hive组件进行存储,以满足计算需求。在交通大数据计算方面,除了传统的数据挖掘方法实现外,还要考虑数据挖掘时交通分析相关算法的并行实现,MapReduce计算模型用于大规模数据集的计算,可以方便、高效的将程序运行在分布式系统上[4]。
1.2系统架构设计
本系统的设计与实现,是基于Hadoop分布式系统架构的,Hadoop框架的核心部分包括HDFS和MapReduce,HDFS为底层数据存储提供支持,MapReduce为海量数据提供计算支持。Hadoop的主要优势体现在其可扩展性、高效性和可靠性等方面。根据交通大数据的特点,基于Hadoop框架设计智能交通分析平台总体架构,如图1所示。该总体架构组要分为数据采集层、数
原创力文档


文档评论(0)