- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据处理平台、智能算法及其评测
大数据处理平台、智能算法及其评测
陈敏刚 博士
上海计算机软件技术开发中心
上海市计算机软件评测重点实验室
cmg@
2015/9/18
一、大数据、物联网、智慧城市的思考
智慧城市:运用先进的信 智能 智慧
电网 交通
息技术,实现城市智慧管 智慧
理与运行,为城市中的人
创造更美好的生活。 智慧 智慧
旅游 城市 医疗
物联网:通过RFID 、 数据处理 大数据:大小超
GPS、传感器等传感 大数据 出传统数据处理
设备与互联网连接起 物联网 工具存储、处理
来,进行信息交换和 (云计算) 分析、能力的数
通讯,实现智能化识 数据采集 据集。(麦肯锡)
别、定位、监控与管
理。
上海市计算机软件评测重点实验室 上海计算机软件技术开发中心 2
二、大数据数据质量、处理框架及测评
1 概述
2 数据质量及评估
3 分布式数据处理框架及测评
4 大数据的基准测试
上海市计算机软件评测重点实验室 上海计算机软件技术开发中心 3
概述
• 大数据环境下,传统的数据处理技术无法满足对大数据量
分析和处理的要求,大数据治理、大数据处理技术应运而
生。
• 数据来源的不同、数据形式的多元化,使得数据质量存在
较大的差异,不正确或者不一致的数据可能严重影响数据
分析效果。
• Hadoop 、Spark为代表的各种大数据框架不断涌现,这些数
据处理框架方便了大数据应用的编写,但是由于其分布性
和封装性,给应用程序的测试带来巨大挑战。
上海市计算机软件评测重点实验室 上海计算机软件技术开发中心 4
大数据处理流程
• 使用相关工具对分布广泛的非结构化的数据源进
行抽取/采集,并进行数据传输
• 采用合适的模式/标准对数据进行统一存储
• 利用智能算法,对数据进行分析处理
• 数据分析处理的结果,通过可视化的方法,提供
给大数据应用 (预测、分析报表、…)
模式 可视化
数据集成 关系
数据源 聚类和关联 数据库 应用
数据集成 实体
数据质量
数据质量
上海市计算机软件评测重点实验室 上海计算机软件技术开发中心
您可能关注的文档
最近下载
- invoee英沃 VC610系列数控机床专用变频器使用说明书.pdf VIP
- 图形化一级全真模拟题.docx VIP
- 政教处主任职责及学生心理健康工作.docx VIP
- 全国青少年软件编程(python)等级考试模拟卷7(一级).docx VIP
- 5.2 珍惜师生情谊 课件-2024-2025学年统编版道德与法治七年级上册.pptx VIP
- 实用教程一级U4过去将来时.docx VIP
- 广东省家庭医生式签约服务团队.doc VIP
- 青少年软件编程(Python)等级考试试卷(一级).39.docx VIP
- WIN7操作系统练习题题库版.docx VIP
- 初中解一元二次方程计算练习.docx VIP
文档评论(0)