- 27
- 0
- 约9.28千字
- 约 10页
- 2016-12-13 发布于贵州
- 举报
第 1 章1.6 定义下列 数据挖掘功能: 特征化、区分、关 联和相关分析、 预测聚 类和演变分析。使用你熟悉的现实生活的数据库,给出每种数据挖掘功 能的例子。
? 特征化是一个目标类数据的一般特性或特性的汇总。例如,学生的特征 可被提出,形成所有大学的计算机科学专业一年级学生的轮廓,这些特 征包括作 为一种高的年级 平均成绩 (GPA:Grade point aversge) 的信息, 还有所修的课程的最大数量。
? 区 分是将 目标 类数 据对 象的 一般 特性 与一个 或多 个对 比类 对象 的一 般 特性进 行比较。例 如,具有高 GPA 的学生 的一般特性 可被用来与 具有 低 GPA 的一般 特性比较。 最终的描述 可能是学生 的一个一般 可比较的 轮廓,就像具有高 GPA 的学生的 75%是四年级计算机科学专业的学生, 而具有低 GPA 的学生的 65%不是。
? 关联是指发现关联规则,这些规则表示一起频繁发生在给定数据集的特 征 值 的 条 件 。 例 如 , 一 个 数 据 挖 掘 系 统 可 能 发 现 的 关 联 规 则 为 :
major(X, “computing science”)owns(X, “personalcomputer”) [support=12%,confidence=98%]
其中,X 是一个表示学生的变量。这个规则指出正在学习的学生,1
您可能关注的文档
- 教材配套宏习题与答案.doc
- 教案六年级册unit6The story of rain.doc
- 教案设计高基和他的儿子.doc
- 教科版九年各单元检测题.doc
- 教科版二年品德与生活下册教案.doc
- 教科版小学学上下册实验操作试题.doc
- 教职工健康识测试题.doc
- 教科版语文年级下册第六单元教学设计.doc
- 教职工安全训会记录.doc
- 教育咨询电约访宝典.doc
- 新疆塔城地区第一高级中学2025-2026学年高一下学期学情自测物理试卷(含解析).docx
- 苏教版五年级上册数学 期中检测卷.doc
- 新疆维吾尔自治区昌吉回族自治州呼图壁县2025-2026学年九年级上学期1月期末英语试题(含解析).docx
- 新疆维吾尔自治区和田地区和田市2025-2026学年上学期八年级英语期末试卷(含解析).docx
- 四川省绵阳市游仙区2025-2026学年七年级上学期1月期末英语试题(含解析).docx
- 苏教版三年级上册数学 第三单元测试题.doc
- 四川省绵阳市梓潼县2025-2026学年八年级上学期1月期末物理试题(含解析).docx
- 四川省绵阳市盐亭县四校联考2025-2026学年八年级下学期物理学情自测(含解析).docx
- 房颤患者太极拳练习.pptx
- 苏教版五年级上册数学 期末检测卷.doc
最近下载
- 基于阻尼因子补偿的LDO设计与实现-微电子学与固体电子学专业论文.docx VIP
- 运动和力复习课件.ppt VIP
- 【高考真题】2023年高考理综物理真题试卷——新课标卷(含答案).docx VIP
- 基于DSP的飞剪控制系统设计.doc VIP
- 元素化合物11碳族硼族.pdf VIP
- 滴丸工岗位合规化操作规程.docx VIP
- 基于WebSocket的协同编辑系统的设计与实现.docx VIP
- 2025年海南省机关事业单位招聘雇员及村(社区)工作人员考试(公共基础知识及公文写作)历年参考题库含.docx VIP
- ISO22000-2018食品安全管理体系的过程和文件清单.pdf VIP
- 船舶危险源 机舱风险源清单.pdf VIP
原创力文档

文档评论(0)