信息技术 基础模块上下册4.4初识大数据.pptxVIP

  • 14
  • 0
  • 约小于1千字
  • 约 9页
  • 2023-09-16 发布于江西
  • 举报

信息技术 基础模块上下册4.4初识大数据.pptx

4.4 初识大数据第4单元 数据处理 问1什么是大数据?它有哪些特点?2技术角度:指传统数据处理应用软件不足以处理的大或复杂的数据集。资源角度:指海量、高速增长和多样化的信息资产。特点体量大:存储的数据能达TB、PB、EB、ZB级;数据类型多:存储的数据钦多种结构化数据、半结构化数据和非结构化数据等形式;数据产生速度快:大数据通过多维度的自动采集和记录,积累速度快,并具有一定的流动性;数据价值密度低:大数据蕴含着大价值,但需要通过专业的技术手段加以处理才能发现。 问2大数据的处理流程是什么?LOREM数据采集数据预处理数据存储数据挖掘数据呈现从传感器或其他采集设备获取信息,包括实时数据和非实时数据,如道路监控、网页浏览、在线支付、外卖订购等数据清洗,即消除在数据采集的过程中由于人为疏忽、设备异常或抽样方法不合理等因素造成的数据误差、数据遗失、重复等,以提高数据质量和完整性。大数据存储需要分布式文件系统和分布式数据库的支持,NOSQL(非关系型数据库)是大数据存储常使用的数据库。可发掘先前未知具潜在有用的信息模型或规则,以产生有价值的信息和知识,帮助决策者做出适当的决策,数据挖掘所处理的问题类型分为分类、预测、有序关联规则四种。大数据的可视化技术,能够帮助人们有效理解数据,以真正利用好大数据,分结构可视化、功能可视化、关联关系可视化和发展趋势可视化。 问3大数据主要应用在哪些场景

文档评论(0)

1亿VIP精品文档

相关文档