- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
浅谈大数据在民航领域的应用
大数据也被称为未来的新石油和矿产,它的出现开启了大规模生产、分享和应用数据
的时代,能让我们通过对海量数据进行分析,以一种前所未有的方式获得全新的产品、服务
或独到的见解,最终形成变革之力,实现重大的时代转型。这就好比当我们感受浩瀚无垠的
宇宙时,用望远镜只能看到宇宙的冰山一角,但更广阔的区域都在表面之后,等待着进一步
的探索。大数据正在改变我们的生活及理解世界的方式,正在成为新发明和新服务的源泉,
同时也为各行业发展提供了前进的驱动力,民航业也在其中。
二:大数据技术
1大数据概念
大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速
发展为数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、
创造新价值、提升新能力的新一代信息技术和服务业态。
2大数据的特征
大数据具有十分广泛的特性;例如高速性,规模性,多样性,价值型,有效性,真实性
等;而现在大数据业内普遍认为大数据主要具有4V特征,即Volume(体量大)、Variety
(种类多)、Velocity(速度快)和Value(价值高)
特性特性描述
Volume
(体量大)大数据,顾名思义,在于其大上;数据的储存从最初的TB增长到ZB的程
度,这与大数据的数据储存技术和网络应用技术的提升密切相关;数据加工处理技术的快速
提升,网络宽带的高速发展和社交软件的大幅度应用都为这一进步提供了大量的数据储存量,
极大促进了大数据的发展。据统计,从文字出现到21世纪初,人类产生的数据总量只相当
于现在两天的数据流量;IDC(国际数据资讯公司)曾预测:2013年全球储存的数据预计达
到1.2ZB;处理如此多的数据全要归功于大数据技术的发展,大数据技术也确实为我们提供
了相当大的便利;例如:腾讯的QQ和微信每天均有上千万条的数据需要分析存储,正是基
于大数据技术的应用,才为人们提供了如此便捷实用的处理人际关系的软件。
Varety
(种类多)大数据与传统数据的不同在于,它的数据来源更广,维度更多,数量也更繁
杂;而数据也分为关系型和非关系型,这也就意味着大数据需要辨别数据彼此之间的关系特
征,发现其内在关联。随着科技的快速发展,数据不仅仅局限于机器仪表自动产生的数据,
还包涵了人自身的生活行为;数据种类也各中各样,从原本的文字和数字等结构化数据延伸
到现在的音频,录像,网络日志,图片,点击量和其他一切有用的信息非结构化数据,且占
整体数据的90%以上,而大数据的作用就在于在海量信息中筛选出有用的,抛弃无用的;对
与有用有关联的进行收集,分析,加工,使之成为有用的信息。
Velocity
(速度快)大数据与传统数据和小数据有一点显著的不同:大数据的数据生成,储存,
分析,处理的速度要远高于传统数据和小数据。例如:欧洲的核子研究中心CERN的离子对
撞机每秒生成的数据高达40TB,一台波音飞机的喷气发动机每半小时产生10TB的运行数据,
再有我国超级计算无锡中心研制的神威-太湖之光在ISC上荣耀夺冠,该系统峰值性能达
12.5亿亿次/s,其一分钟计算能力相当于全球七十亿人用计算器连续计算32年
Value
(价值高)大数据有巨大的潜在价值,其价值具有稀缺性。假设把数据比作一处海域,
大数据技术则是帮助你寻找你所需要的物质,甚至可以实现意义上的海底捞针
3大数据的处理流程
大数据的到来导致一场信息时代的变革,大量的结构化数据和非结构化数据需要人们进
行分离、整理、归类、存档、分析等操作,而我们也通过以上操作来获取自己想要的数据。
因此,做好大数据的采集,导入与预处理,统计与分析,挖掘是十分重要的
3-1大数据的采集
大数据的采集通常运用多个数据库的连接来进行终端数据采集,包括智能硬件端,移动
APP应用端,网页端等。例如电商平台一般使用传统的关系数据库MySQL和Oracle来存储每
笔业务数据信息;腾讯则将数据以NoSQL高速存储方式存储在数据洞当中。
数据的采集方式分为数据抓取、数据导入、物联网传感设备自动信息采集几种方式。在
数据进行采集时主要遇到的问题还是对多个数据进行同时抓取时并发问题,毕竟有时是同时
您可能关注的文档
- 2023年施工员之市政施工基础知识通关考试题库带答案解析 .pdf
- 基础化学中引入计算机基础知识教改探讨 .pdf
- 2023年持证上岗管理规定 .pdf
- 社区工作者个人年终工作总结1 .pdf
- 江苏省南京市2023-2024学年高三上学期期初学情调研地理试卷.pdf
- 2023年【上海市安全员C证】考题(附答案) .pdf
- 2023年维修电工技师考试试题及答案 .pdf
- 计算机基础知识练习试题附答案 .pdf
- 现代测量数据处理理论试卷 .pdf
- 职业能力倾向测验》+《公共基础知识》《医学基础知识》 .pdf
- 清华五道口:全国城市新市民数字金融服务指数报告(2024).pdf
- 解数第258期:认养一头牛-双寡格局下,新品牌如何实现弯道超车.pdf
- 复旦大学(张奇):2024年大语言模型的能力边界与发展思考报告.pdf
- 天津大学:2024年大模型轻量化技术研究报告.pdf
- 运动鞋代工:体育产业政策扶持叠加海外补库预期升温,中国运动鞋代工行业景气度有望持续提升.pdf
- 复旦大学(张奇):2023年大规模语言模型中语言与知识报告.pdf
- 2024年诺奖得主对ESG的研究与企业ESG的内在逻辑研究报告.pdf
- 奋迅·贝克麦坚时:粤港澳大湾区法律与合规实务指南(2024版).pdf
- 2024年溯及既往的规则-新公司法时间效力司法解释研究报告.pdf
- 2024年洞悉心声,引领潮流-文创产业发展中的消费者洞察报告.pdf
文档评论(0)