- 10
- 0
- 约6.69千字
- 约 8页
- 2017-03-15 发布于北京
- 举报
在Hadoop基础上的数据处理系统的构建研究
第 1 章 绪论1.1 研究背景和意义随着科技的进步以及互联网技术的不断提高,越来越多的智能设备被人们所使用。而如今物联网、云计算等新兴技术也开始逐步影响着人们的生活,随之而来的就是这些数据载体所导致的数据量增长的问题,比如 Facebook 每天所要处理的数据量就在 500TB 左右,如何处理这些海量数据成为了每个公司发展的瓶颈。据统计,截至到 2015 年全球的数据量将达到 8.5ZB,而且将以每 18 个月翻一番的趋势增长,其中以电子商务交易数据、社交网络数据和移动终端数据为代表的三大主导非结构化数据将占全球数据总量的 90%[1]。无疑,大数据的时代已经到来。本文要处理的数据是温度传感器采集的数据,因此在短时间内就会产生大量的数据,而且这些数据是不断增长的,如果采用传统的数据存储模式即使用处理能力很强的大型机和关系型数据库,即将全部数据存储到具有很大容量的磁盘上。虽然近年来磁盘的存储容量不断增加,但是其访问速度却未能与时俱进,比如读取具有 1TB 数据的磁盘,其速度传输速度为 100MB/s,读取完所有数据仍需要 1个小时[2]。所以面对这些不断增长的温度数据,即使再大容量的机器也不能从根本上解决大数据的存储问题;而关系型数据库的缺点是只能存储结构化的数据、没有较好的弹性和容错性等,所以传统的处理模式已经不能满足要求了。
您可能关注的文档
- 国家的基础制度.doc
- 国家的起源和本质.docx
- 国家职业准则模具制造工.doc
- 国家药品不良反应监测年度报告[2014年].doc
- 国家豁免的范围.doc
- 国情教育工作的计划.doc
- 国成百货员工手则.doc
- 国有企业[三级分解].doc
- 国有企业怎样留住人才.doc
- 国有资产的管理论文.doc
- 2026届甘肃省民勤三中高考化学三模试卷含解析.doc
- 2021年人力资源年终工作汇报 附2026年人力预算测算表 可直接套用.pptx
- 2021年直播间氛围打造提升停留时长培训课件.pptx
- 2026届广西钦州市第二中学高三第二次模拟考试历史试卷含解析.doc
- 2020应对儿童厌学叛逆专属心理健康教育宣讲课件.pptx
- 2026届江苏省南通巿启东中学5月高三月考物理试题.doc
- 2026年初中语文写作课件.pptx
- 2026年电子元件检测实训教程PPT.pptx
- 2026届安徽省肥东县圣泉中学高三下期末模拟联考数学试题.doc
- 广东省惠东县惠东高级中学2026届高三考前热身生物试卷含解析.doc
最近下载
- 2023压力容器设计审核人员考试题库-1.docx VIP
- 贵州省健康培训管理平台医疗放射培训试题.docx VIP
- 交通管理与控制定期更新第十章交通信号控制概论幻灯片.ppt VIP
- 2023年北京东城中考数学真题及答案.pdf VIP
- 半导体物理基础:半导体器件模型_(5).PN结理论:能带图、电流-电压特性.docx VIP
- 装配式预应力混凝土简支T梁桥毕业设计.doc VIP
- 基于AspenPlus的工业甲醇合成工艺设计与优化.docx VIP
- 山东省青岛市李沧区2024-2025学年七年级下学期期中生物试题.pdf VIP
- 古建筑彩画保护修复材料与工艺研究初探-以故宫乾隆花园彩画修复为例.docx VIP
- 2021版 客户侧电能计量装置通用设计要求 第1部分 10kV用电客户电能计量装置.docx VIP
原创力文档

文档评论(0)