网站大量收购闲置独家精品文档,联系QQ:2885784924

甲骨文大数据实训实践.doc

  1. 1、本文档共13页,其中可免费阅读6页,需付费170金币后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE15

甲骨文大数据实训

一、实践目的

数据处理在于数据分析中是最重要的一步,其相关的工作时间占据了一个项目的70%以上。数据的质量,直接决定了模型的预测和泛化能力的好坏。它涉及很多因素,包括:准确性、完整性、一致性、时效性、可信性和解释性。而在真实数据中,我们拿到的数据可能包含了大量的缺失值,可能包含大量的噪音,也可能因为人工录入错误导致有异常点存在,非常不利于算法模型的训练。数据清洗的结果是对各种脏数据进行对应方式的处理,得到标准的、干净的、连续的数据,提供给数据统计、数据挖掘等使用。

数据预处理的主要步骤分为:获取数据、清洗数据、数据抽取及合并、计算数据、数据类型转换、

文档评论(0)

黄莺文化 + 关注
实名认证
内容提供者

文档分享

1亿VIP精品文档

相关文档