- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
未来的世界将不再由石油驱动,而是由数据驱动 大数据案例(1)腾讯——大数据技术促使腾讯视频成为国内第一?? ?(2)T-Mobile——大数据帮助移动运营商降低客户流失率?? ?(3)TXU Energy——智能电表?? ?(4)麦克拉伦一级方程式车队——借助大数据技术,降低事故,保驾护航?? ?(5)UPS快递——大数据技术下的最佳行车路径?? ?(6)DPR——用大数据设计建筑?? ? 要数据有何用?可穿戴设备必须告诉用户该做什么 数码设备变得越来越善于收集数据。有些人还就健身追踪器和手机的精度进行讨论,但这其实并不重要。我可以打开 iOS 中的 Health 应用,然后查看计步读数,系统甚至还知道我上了登机梯!你甚至可以只通过智能手机来收集这些数据,不久后,这些传感器将无处不在,出现在你的手表、鞋子、衬衫和隐形眼镜中。“健身追踪”将不再以设备形式出现,而会成为一项功能,就像 Wi-Fi 功能一样。 对于许多人来说,收集数据就足以促使他们更多地运动或睡更多觉。比如,牛津大学生理神经科学教授 Russell Foster 称,大多数人认为自己的睡眠质量要比实际睡眠质量差。对于这些人而言,有客观的指标来参考会减轻不少痛苦。 但许多用户需要的不仅仅是这些。《美国医学会期刊》发表的一项引发诸多争议的研究表明,拥有一台健身追踪设备并追踪数据只是迈向更健康生活的一小步,几乎没有用处。这是近一半用户几乎立即停止使用健身追踪设备的原因。这也是 Jawbone、Fitbit、微软以及其他厂商推出功能超强设备的原因,为了让用户持续使用。所有这些设备都能收集更多数据,但只有很少设备找到好好利用这些数据的方式。 物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。 有些例子包括网络日志,RFID,传感器网络,社会网络,社会数据(由于数据革命的社会),互联网文本和文件;互联网搜索索引;呼叫详细记录,天文学,大气科学,基因组学,生物地球化学,生物,和其他复杂和/或跨学科的科研,军事侦察,医疗记录;摄影档案馆视频档案;和大规模的电子商务。 特点 数据量大(Volume)。第一个特征是数据量大,包括采集、存储和计算的量都非常大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。 类型繁多(Variety)。第二个特征是种类和来源多样化。包括结构化、半结构化和非结构化数据,具体表现为网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。 价值密度低(Value)。第三个特征是数据价值密度相对较低,或者说是浪里淘沙却又弥足珍贵。随着互联网以及物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何结合业务逻辑并通过强大的机器算法来挖掘数据价值,是大数据时代最需要解决的问题。 速度快时效高(Velocity)。第四个特征数据增长速度快,处理速度也快,时效性要求高。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐算法尽可能要求实时完成推荐。这是大数据区别于传统数据挖掘的显著特征。 从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘,但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。[2]? 随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。《著云台》的分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。 大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。 大数据真的很牛B吗?不不不,分分钟让你读懂它 大数据的概念被吵的越来越厉害,这对于一个新技术领域的诞生是一个必经过程。对于“大数据”(Big Data),研究机构Gartner给出的定义是:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 两年前,《纽约时报》撰文“欢迎大数据的到来”,两年后,大数据的商业价值已经显现。在各个行业,我们都已能看到大数据的身影。 大数据,首先你要能存的下大数据。 传统的文件系统是单机的,不能横跨不同的机器。HD
您可能关注的文档
- 大盘房地产开发项目投资经济方法研究祥解.ppt
- 光明股份有限公司案例祥解.ppt
- 光明集团家具股份有限公司股权分置祥解.ppt
- 大盘价值挖掘案例分享(星河湾)2009祥解.ppt
- 光明乳业财务报告祥解.ppt
- 光明乳业财务分析报告祥解.ppt
- 大盘启动模式祥解.ppt
- 大棚西瓜栽培技术(定稿)祥解.ppt
- 光通信原理与技术第1章祥解.ppt
- 大屏幕显示技术祥解.ppt
- 2025-2026学年高中物理必修 第三册教科版(2019)教学设计合集.docx
- 2025年文旅景区淡季景区旅游产品创新与体验设计研究.docx
- 广西口腔住院医师规范化培训《牙周病学必看题库知识点》新版_0.doc
- 2025年基础教育“双减”政策对教师教学负担减轻效果评估报告.docx
- 2025年工业互联网平台用户付费意愿与行业应用场景分析报告.docx
- 2025年智能巡检激光雷达固态化技术应用案例研究.docx
- 2025-2026学年高中物理必修 第三册鲁科版(2019)教学设计合集.docx
- 2025年城市公园照明系统智能化升级项目实施方案.docx
- 碳中和目标下能源互联网与可再生能源协同发展研究报告.docx
- 2025年城市公园照明系统智能化改造可行性研究.docx
文档评论(0)