- 83
- 1
- 约小于1千字
- 约 13页
- 2020-05-12 发布于江苏
- 举报
大数据交易中心构架;大数据利用流程;收集数据主要来源:
政府数据,目前占比约80%如公民信息、纳税数据、公积金数据、公共服务数据(水电煤气等)
商业数据,占比约20%如淘宝商家、购买者资料,微信用户资料,生产商产品库等
PS1:部分数据难以分类,为公共服务社会化后的数据,如电信移动用户资料。
PS2:收集数据的同时,也是转化部分非格式化数据使其格式化、索引化,以便机器识别利用的过程。;“大数据” (Big data),定义之一,需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。由此可见数据处理流程对于大数据应用的重要性和困难性,包括:
数据清洗检查数据一致性,处理无效值和缺失值,即去除“杂质”,部分数据需要进行“脱敏”处理。
数据拆分格式化,分类,去重,等。
数据存储分布式存储、块存储、流存储,行存储、列存储,等。
数据汇聚根据需要重新组合。;按标的物分:
(部分/完整)所有权交易(交换)
(部分/完整)使用权交易(交换)
按品种分:
源数据-土豆
数据产品-土豆粉
数据工具或数据模型-麦当劳薯条;V1.0版的数据交易中心,关注重点在于撮合买卖双方达成交易,而忽略了大数据的优势在于服务,而成功的关键大数据的挖掘成果和通过汇聚效应得到的新数据。
通过分类 (Classification)、 估计(Estimation)、预测(
您可能关注的文档
- 基于模型的汽车零部件设计与加工新技术应用.pdf
- 面向未来的汽车零部件云上开放操作系统平台.pdf
- 汽车零部件数字化建设现状及未来建设趋势.pdf
- ARP广告传媒企业(项目)管理平台.ppt
- IBP平台——内部数据服务平台.ppt
- iMeal爱美味在线订餐平台.ppt
- IMMC云平台技术路线图-01概述.pptx
- IMMC云平台技术路线图-02第一阶段详细设计分册.pptx
- iYaboo网络翻译协作平台.ppt
- Mugeda-移动教育课件制作与管理平台.ppt
- 四川省成都市嘉祥教育集团2024-2025学年七年级下学期期中数学试题(解析版).docx
- 四川省成都市青羊区石室联合中学2024-2025学年七年级下学期期中考试数学试题(解析版).pdf
- 四川省成都市青羊区石室联合中学2024-2025学年七年级下学期期中考试数学试题(解析版).docx
- 四川省成都市武侯区北京第二外国语学院成都附属中学2024-2025学年七年级下学期期中数学试题(解析版).docx
- 四川省成都市武侯区北京第二外国语学院成都附属中学2024-2025学年七年级下学期期中数学试题(解析版).pdf
- 四川省绵阳市涪城区2024-2025学年七年级下学期5月期中考试数学试题(解析版).pdf
- 四川省绵阳市涪城区2024-2025学年七年级下学期5月期中考试数学试题(解析版).docx
- 四川省绵阳市江油市2024-2025学年七年级下学期5月期中数学试题(解析版).pdf
- 四川省绵阳市江油市2024-2025学年七年级下学期5月期中数学试题(解析版).docx
- 四川省绵阳市游仙区2024-2025学年七年级下学期5月期中考试数学试题(解析版).docx
原创力文档

文档评论(0)