数据挖掘课后标准标准答案.docVIP

  • 3
  • 0
  • 约1.06万字
  • 约 15页
  • 2019-03-12 发布于江苏
  • 举报
个人收集整理 仅供参考学习 个人收集整理 仅供参考学习 PAGE / NUMPAGES 个人收集整理 仅供参考学习 第一章 1.6 (1)数据特征化是目标类数据地一般特性或特征地汇总. 例如,在某商店花费1000元以上地顾客特征地汇总描述是:年龄在40—50岁、有工作和很好地信誉等级. (2)数据区分是将目标类数据对象地一般特性与一个或多个对比类对象地一般特性进行比较. 例如,高平均分数地学生地一般特点,可与低平均分数地学生地一般特点进行比较.由此产生地可能是一个相当普遍地描述,如平均分高达75%地学生是大四地计算机科学专业地学生,而平均分低于65%地学生则不是.b5E2RGbCAP (3)关联和相关分析是指在给定地频繁项集中寻找相关联地规则. 例如,一个数据挖掘系统可能会发现这样地规则:专业(X,“计算机科学”)=拥有(X,”个人电脑“)[support= 12%,confidence = 98%],其中X是一个变量,代表一个学生,该规则表明,98%地置信度或可信性表示,如果一个学生是属于计算机科学专业地,则拥有个人电脑地可能性是98%.12%地支持度意味着所研究地所有事务地12%显示属于计算机科学专业地学生都会拥有个人电脑.p1EanqFDPw (4)分类和预测地不同之处在于前者是构建了一个模型(或函数),描述和区分数据类或概念,而后者则建立了一个模型来预测一些丢失或不可

文档评论(0)

1亿VIP精品文档

相关文档