《工业大数据与人工智能》 课件 第二章-2.4 工业大数据处理.pptx

《工业大数据与人工智能》 课件 第二章-2.4 工业大数据处理.pptx

  1. 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
  2. 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  3. 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

工业大数据与人工智能HFUT1

2数据预处理分布式计算第二章工业大数据分布式计算的相关计算形式分布式计算范型流式计算的工作流程流式计算2.4.工业大数据处理分布式计算的定义

3数据预处理由于实际数据可能存在噪声、不一致性、冗余、缺失、异常值、重复记录以及类别不平衡等诸多问题,未经预处理的数据易导致挖掘结果偏差。因此,在挖掘前,须对原始数据进行系统性优化,降低后续分析与建模的误差。数据预处理主要包括严格审核数据完整性与准确性,通过逻辑和计算检查识别不合理内容和错误。审核完成后,进入数据筛选流程,该阶段旨在选取适用于分析的有效数据,并整合多源数据。

4数据预处理步骤(1)数据清洗:缺失值

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档