- 2
- 0
- 约4.74千字
- 约 49页
- 2017-10-18 发布于浙江
- 举报
大数据技的术概述
数据挖掘的功能类型 关联规则 序列模式 聚类挖掘 分类挖掘 预测挖掘 孤立点挖掘 文本挖掘 网络挖掘 …… 关联规则(Association) 反映一个事件和其他事件之间依赖或关联的知识 如果两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测 可以用关联规则的形式表示 规则形式: “A ? B [support, confidence]”. 应用: 业务相关性分析 交叉销售 货架摆放位置 页面结构设计等 挖掘顺序发生的事件中的模式 给定序列数据库和最小支持度阈值,序列模式挖掘就是要找出序列数据库中所有的序列模式 序列模式挖掘 序列模式挖掘 应用: 用户访问模式预测 用户移动模式挖掘 用户点击流分析 DNA序列分析 自然灾害预测 疾病病症预测 …… 聚类(Clustering) 最大化类内的相似性、最小化类间相似性的原则进行聚类或者分组,使得在一个类中的对象具有很高的相似性,而与其他类中的对象很不相似 簇(Cluster):一个数据对象的集合 在同一个类中,对象之间具有相似性 不同类的对象之间是相异的 聚类分析:把一个给定的数据对象集合分成不同的簇 特点:一种无监督分类法,没有预先指定的类别 Page* 聚类挖掘的应用 用户细分与市场营销: 帮助市场人员发现客户中的不同群体,然后用这些知识来开展一个目标明确的市场计划; 土地使用: 在一个陆地观察数
原创力文档

文档评论(0)