商务智能数据挖掘原理.pptVIP

  • 14
  • 0
  • 约2.33万字
  • 约 40页
  • 2022-05-17 发布于重庆
  • 举报
噪声 这种噪声可能是由用户的错误输入或是顾客填写问卷时的笔误造成的。如果这些错误不是发生的太频繁,数据挖掘工具还是能够忽略它们,并且找出数据中存在的整体模式。 第三十一页,共四十页。 脏数据形成的原因 滥用缩写词 数据输入错误 不同的惯用语(如:ASAP对“at first chance”) 重复记录 丢失值 拼写变化 不同的计量单位 过时的编码 第三十二页,共四十页。 数据清洗 (客户数据) Maggie. Margaret Smith-Kline phd FUTURE Electronics 5/23/03 101 6th ave manhattan ny 10012 001124367 Salutation: Ms. First name: Margaret Last name: Smith-Kline Postname: Ph. D. Match standards: Maggie, Peg, Peggy Gender: Strong Female Company name: Future Electronics Address 1: 101 Avenue of the Americas City: New York State: NY ZIP+4: 10013-1933 Email: maggie. SSN: 001-12-4367 Date May 23

文档评论(0)

1亿VIP精品文档

相关文档