- 5
- 0
- 约3.54万字
- 约 76页
- 2016-05-01 发布于湖北
- 举报
* 海量交易数据: 企业内部的经营交易信息主要包括联机交易数据和联机分析数据,是结构化的、通过关系数据库进行管理和访问的静态、历史数据。通过这些数据,我们能了解过去发生了什么。 海量交互数据: 源于Facebook、Twitter、LinkedIn及其他来源的社交媒体数据构成。它包括了呼叫详细记录CDR、设备和传感器信息、GPS和地理定位映射数据、通过管理文件传输Manage File Transfer协议传送的海量图像文件、Web文本和点击流数据、科学信息、电子邮件等等。可以告诉我们未来会发生什么。 海量数据处理: 大数据的涌现已经催生出了设计用于数据密集型处理的架构。例如具有开放源码、在商品硬件群中运行的Apache Hadoop * 第一V是Variety,海量数据有不同格式,第一种是结构化,我们常见的数据,还有半结据化网页数据,还有非结构化视频音频数据。而且这些数据化他们处理方式是比较大的。很多不同形式(文本、图像、视频、机器数据),无模式或者模式不明显,不连贯的语法或句义 第二点就是Volume,量比较大,我们有一些用户化每秒就要进入很多数据,很多客户内部都有几批数据,还有下面淘宝都是几PB数据,所以PB化将是比较常态的情况。非结构化数据的超大规模和增长,占总数据量的80~90%,比结构化数据增长快10倍到50倍,是传统数据仓库的10倍到50倍 第三个是Veloci
您可能关注的文档
最近下载
- 2025年上海铁路局集团有限公司招聘3347人二(高等职业院校)(公共基础知识)测试题附答案.docx VIP
- 预防纠正措施培训.ppt VIP
- 中国共产主义青年团团员登记表(2025年版).docx VIP
- 家政行业年后服务人员培训与客户拓展【PPT文档】.pptx VIP
- 《因果推断实用计量方法》大学教学课件 第9章 双重差分法.pptx VIP
- 2024深信服PT1-aDesk认证实验考试.doc VIP
- 【护理PPT分享】肿瘤患者肠内营养耐受不良专家共识.pptx
- 新概念英语第二册+Lesson+64+The+channel+tunnel+讲义.docx VIP
- 富平县辅警考试真题及答案2022 .pdf VIP
- (正式版)DB54∕T 0117-2017 《西藏生态安全屏障生态监测技术规范》.docx VIP
原创力文档

文档评论(0)