- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 数据挖掘原理与SPSS Clementine应用宝典 元昌安 主编 邓 松 李文敬 刘海涛 编著 电子工业出版社 * 概念/类描述 关联模式 分类 聚类分析 预测 时间序列 偏差检测 概念/类描述就是通过对某类对象关联数据的汇总、分析和比较,用汇总的、简洁的、精确的方式对此类对象的内涵进行描述,并概括这类对象的有关特征。 概念描述分为特征性描述和区别性描述。 特征性描述是指从与某类对象相关的一组数据中提取出关于这些对象的共同特征。生成一个类的特征性描述只涉及该类对象中所有对象的共性。 区别性描述描述两个或更多个不同类对象之间的差异。生成区别性描述则涉及目标类和对比类中对象的共性。 2.1 概念/类描述 2.1 概念/类描述 数据特征的输出可以用多种形式提供。包括饼图、条图、曲线、多维数据方和包括交叉表在内的多维表。结果描述也可以用泛化关系或规则(称作特征规则)形式提供。 例如:利用面向属性的归纳方法(AOI),在一个商场数据库(2000销售)中进行属性归纳操作,获得了如下的归纳结果: 表2-1 AOI方法挖掘结果表格表示示意描述 地点 商品 销售额(百万) 个数累计(千) 亚洲 欧洲 北美 亚洲 欧洲 北美 电视 电视 电视 电脑 电脑 电脑 15 12 28 120 150 200 300 250 450 1000 1200 1800 2.1 概念/类描述 对于以上结果,也可以用组合表(crosstab)或其他图表的形式来加以描述。数据分析中可视化图示非常普遍。 表2-2 对应表2-1的组合表表示描述 图2-1 对应表2-2棒图表示描述 TV Computer TV+Computer sales count sales count sales count Asia 15 300 120 1000 135 1300 Europe 12 250 150 1200 162 1450 North_Amaerica 28 450 200 1800 228 2250 All_region 45 1000 470 4000 525 5000 item Location 2.1 概念/类描述 图2-2 对应表2-1(部分数据)的饼图表示描述 北美 51% 亚洲 27% 欧洲 22% 电视销售图 2.1 概念/类描述 区别性描述是将目标类对象的一般特性与一个或多个对比类对象的一般特性比较。这种比较必须是在具备可比性的两个或多个类之间进行。 例如,对某校讲师和副教授的特征进行比较,可能会得到这样一条规则: “讲师:(78%)(paper3)and (teaching course2)”, 而 “副教授:(66%)(paper=3)and (teaching course=2)”; 该对比规则表示该校讲师中约有四分至三的人发表论文少于三篇且主讲课程不超过一门;而对比之下该校副教授中约有三分至二的人发表论文不少于三篇且主讲课程不少于一门。 2.2 关联模式 关联模式挖掘旨在从大量的数据当中发现特征之间或数据之间的相互依赖关系。这种存在于给定数据集中的频繁出现的关联模式,又称为关联规则。关联可分为简单关联、时序关联、因果关联等。这些关联并不总是事先知道,而是通过数据库中数据的关联分析获得的,其对商业决策具有重要价值。因而关联分析广泛用于市场营销、事务分析等应用领域。 挖掘关联知识的一个典型应用实例就是市场购物分析。根据被放到一个购物袋的(购物)内容记录数据而发现的不同(被购买)商品之间所存在的关联知识无疑将会帮助商家分析顾客的购买习惯。发现常在一起被购买的商品(关联知识)将帮助商家指定有针对性的市场策略。 比如:顾客在购买牛奶时,是否也可能同时购买面包或会购买哪个牌子的面包,显然能够回答这些问题的有关信息肯定回有效地帮助商家进行有针对性的促销,以及进行合适的货架商品摆放。如可以将牛奶和面包放在相近的地方或许会促进这两个商品的销售。 2.2 关联模式 根据关联规则所涉及变量的多少,可以分为多维关联规则和单维关联规则。通常,关联规则具有:X ? Y的形式,即”A1 ?...? Am ? B1 ?...? B
您可能关注的文档
最近下载
- 无机非金属材料工艺学课件.pptx VIP
- 6SR550 NXGPRO+ 中压变频器通讯手册A5E50226719J_NXGpro+ Communication Manual_Chinese.pdf VIP
- 无机非金属材料工艺学课件.pptx VIP
- 2024年高中数学同步高分突破讲义(人教A版2019)1.1空间向量及其运算-(选择性必修第一册)(学生版+解析).docx VIP
- 上海证券交易所上市公司业务操作手册.pdf
- 2025年高考语文备考古诗鉴赏之韩琦《次韵答致政杜公以迁职惠诗》.docx VIP
- 军队文职思维导图:公共科目基础知识-非法.pdf VIP
- 冬季施工混凝土施工方案编制依据.docx VIP
- 儿童财商启蒙课课件.pptx
- 最新民宿劳务合同模板.docx VIP
文档评论(0)