大数据交易中心构架.pptxVIP

  • 83
  • 1
  • 约小于1千字
  • 约 13页
  • 2020-05-12 发布于江苏
  • 举报
大数据交易中心构架;大数据利用流程;收集数据主要来源: 政府数据,目前占比约80% 如公民信息、纳税数据、公积金数据、公共服务数据(水电煤气等) 商业数据,占比约20% 如淘宝商家、购买者资料,微信用户资料,生产商产品库等 PS1:部分数据难以分类,为公共服务社会化后的数据,如电信移动用户资料。 PS2:收集数据的同时,也是转化部分非格式化数据使其格式化、索引化,以便机器识别利用的过程。;“大数据” (Big data),定义之一,需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。由此可见数据处理流程对于大数据应用的重要性和困难性,包括: 数据清洗 检查数据一致性,处理无效值和缺失值,即去除“杂质”,部分数据需要进行“脱敏”处理。 数据拆分 格式化,分类,去重,等。 数据存储 分布式存储、块存储、流存储,行存储、列存储,等。 数据汇聚 根据需要重新组合。;按标的物分: (部分/完整)所有权交易(交换) (部分/完整)使用权交易(交换) 按品种分: 源数据-土豆 数据产品-土豆粉 数据工具或数据模型-麦当劳薯条;V1.0版的数据交易中心,关注重点在于撮合买卖双方达成交易,而忽略了大数据的优势在于服务,而成功的关键大数据的挖掘成果和通过汇聚效应得到的新数据。 通过分类 (Classification)、 估计(Estimation)、预测(

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档