CHAPTER3数据预处理资料.pptVIP

  • 6
  • 0
  • 约1.16万字
  • 约 57页
  • 2017-07-11 发布于湖北
  • 举报
* 标称数据的概念分层 用户/专家在模式级显式地指定属性的偏序 streetcitystatecountry 通过显式数据分组说明分层 {厄巴纳,香槟,芝加哥}Illinois 只说明属性集但不说明它们的偏序 系统自动产生属性偏序,根据 每个属性下不同值的数据 启发式规则:相比低层,高层概念的属性通常有较少取值 E.g., street city state country 只说明部分属性值 自动产生概念分层 Some concept hierarchies can be automatically generated based on the analysis of the number of distinct values per attribute in the given data set 含不同值最多的属性放在层次的最低层 Note: Exception—weekday, month, quarter, year country province_or_ state city street 15 distinct values 365 distinct values 3567 distinct values 674,339 distinct values * Summary Data preparation is a big issue for both war

文档评论(0)

1亿VIP精品文档

相关文档