- 14
- 0
- 约小于1千字
- 约 9页
- 2023-09-16 发布于江西
- 举报
4.4 初识大数据第4单元 数据处理
问1什么是大数据?它有哪些特点?2技术角度:指传统数据处理应用软件不足以处理的大或复杂的数据集。资源角度:指海量、高速增长和多样化的信息资产。特点体量大:存储的数据能达TB、PB、EB、ZB级;数据类型多:存储的数据钦多种结构化数据、半结构化数据和非结构化数据等形式;数据产生速度快:大数据通过多维度的自动采集和记录,积累速度快,并具有一定的流动性;数据价值密度低:大数据蕴含着大价值,但需要通过专业的技术手段加以处理才能发现。
问2大数据的处理流程是什么?LOREM数据采集数据预处理数据存储数据挖掘数据呈现从传感器或其他采集设备获取信息,包括实时数据和非实时数据,如道路监控、网页浏览、在线支付、外卖订购等数据清洗,即消除在数据采集的过程中由于人为疏忽、设备异常或抽样方法不合理等因素造成的数据误差、数据遗失、重复等,以提高数据质量和完整性。大数据存储需要分布式文件系统和分布式数据库的支持,NOSQL(非关系型数据库)是大数据存储常使用的数据库。可发掘先前未知具潜在有用的信息模型或规则,以产生有价值的信息和知识,帮助决策者做出适当的决策,数据挖掘所处理的问题类型分为分类、预测、有序关联规则四种。大数据的可视化技术,能够帮助人们有效理解数据,以真正利用好大数据,分结构可视化、功能可视化、关联关系可视化和发展趋势可视化。
问3大数据主要应用在哪些场景
您可能关注的文档
- 数学 拓展模块一(上册)(修订版)3.1椭圆.docx
- 数学 拓展模块一(上册)(修订版)《数学 拓展模块一(上册)》第1章+第5章练习答案.pdf
- 数学 拓展模块一(上册)(修订版)《数学 拓展模块一(上册)》第2章练习答案.pdf
- 数学 拓展模块一(上册)(修订版)《数学 拓展模块一(上册)》第3章练习答案.pdf
- 数学 拓展模块一(上册)(修订版)《数学 拓展模块一(上册)》第4章练习答案.pdf
- 数学 拓展模块一(上册)(修订版)2.1向量的概念.docx
- 数学 拓展模块一(上册)(修订版)2.3向量的内积.docx
- 数学 拓展模块一(上册)(修订版)3.2双曲线.docx
- 数学 拓展模块一(上册)(修订版)1.2充要条件.docx
- 信息技术 基础模块上下册2.2网络配置.pptx
最近下载
- 天津理工大学2023-2024学年第1学期《环境微生物学》期末考试试卷(A卷)附标准答案.docx
- Q-GDW11882-2025 预制舱式10kV、35kV开关设备技术规_可搜索.pdf VIP
- 2025年岑巩事业单位考试题库.doc VIP
- 职业生涯规划与求职就业指导知到智慧树期末考试答案题库2025年中南大学.docx VIP
- 毕节职业技术学院教师招聘考试历年真题 .pdf VIP
- 广东省银行同业新型国际贸易业务展业自律指引(转口).doc VIP
- 广西贵港市平南县2024-2025学年七年级下学期6月期末数学试题(解析版).docx VIP
- 24J306国家建筑标准设计图集.docx
- 通信网理论基础(北京邮电大学)中国大学MOOC慕课章节测验答案(课程ID:1463114161).pdf VIP
- 建筑给水排水及采暖工程施工质量验收规范.doc VIP
原创力文档

文档评论(0)