(精)数据挖掘05数据立方体.pptVIP

  • 10
  • 0
  • 约8.37千字
  • 约 47页
  • 2017-01-07 发布于湖北
  • 举报
面向属性的归纳——示例 主泛化关系 初始工作关系 面向属性的归纳算法 输入 1. DB; 2. 数据挖掘查询DMQuery; 3. 属性列表; 4. 属性的概念分层; 5. 属性的泛化阈值; 输出 主泛化关系P 算法描述: W get_task_relevant_data(DMQuery, DB) prepare_for_generalization(W) 扫描W,收集每个属性a的不同值 对每个属性a,根据阈值确定是否删除,如果不删除,则计算其最小期望层次L,并确定映射对(v,v`) P generalization(W) 通过使用v`代替W中每个v,累计计数并计算所有聚集值,导出P 每个泛化元组的插入或累积计数 用数组表示P 导出泛化的表示 (1) 泛化关系 一部分或者所有属性得到泛化的关系,包含计数或其他度量值的聚集 交叉表 二维交叉表使用每行显示一个属性,使用每列显示另外一个属性将结果集映射到表中 可视化工具: 条形图、饼图、曲线和数据立方体浏览工具(用单元的大小代表计数,用单元亮度代表另外的度量) 导出泛化的表示 (2) 量化规则 使用t_weight表示主泛化关系中每个元组的典型性 量化特征规则 将泛化的结果映射到相应的量化特征规则中,比如: 量化特征规则中每个析取代表一个条件,一般,这些条件的析取形成目标类的必要条件,因为该条件是根据目标类的所有情况导出的

文档评论(0)

1亿VIP精品文档

相关文档