- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
6.8 知识发现 6.8.4 知识发现(数据挖掘)的方法 1. 统计方法 (3)支持向量机 不同的分类超平面 最优分类超平面及其间隔 线性不可分 6.8 知识发现 6.8.4 知识发现(数据挖掘)的方法 1. 统计方法 (4)粗糙集 粗糙集合理论(Rough Set, 也称为RS理论)由波兰数学家Pawlak.Z于1982年提出。粗糙集对不精确概念的描述是通过上近似(upper approximation)和下近似(lower approximation)这两个精确概念来实现的。一个概念(或集合)的下近似是指其中的元组肯定属于该概念;一个概念(或集合)的上近似是指其中的元组可能属于该概念。 6.8 知识发现 6.8.4 知识发现(数据挖掘)的方法 1. 统计方法 粗糙集理论是一种研究不精确、不确定性知识的数学工具,这一方法在数据挖掘中具有重要的作用,通常处理含糊性和不确定的问题,发现不准确数据或噪音数据内在的结构关系,可用于特征的约简和相关分析中。 粗糙集方法优点:不需要预先知道的额外信息,如统计中要求的先验概率和模糊集中要求的隶属度,算法简单,易于操作。 6.8 知识发现 6.8.4 知识发现(数据挖掘)的方法 2. 机器学习方法 可能用于机器发现的机器学习方法有: (1) 规则归纳。 规则反映数据项中某些属性或数据集中某些数据项之间的统计相关性。 (2)决策树。 决策树的每一个非终叶节点表示所考虑的数据项的测试或决策。 (3)范例推理。 范例推理是直接使用过去的经验或解法来求解给定的问题。 6.8 知识发现 6.8.4 知识发现(数据挖掘)的方法 2. 机器学习方法 (4) 贝叶斯网络。 贝叶斯信念网络是概率分布的图表示。贝叶斯网络基于后验概念的贝叶斯定理,是建立在数据进行统计处理基础上的方法,将不确定事件通过网络连接起来,可以对其他相关事件的结果进行预测,其网络变量可以是可见的,也可隐藏在训练样本中。贝叶斯网络具有分类、聚类、预测和因果关系分析的功能,其优点是易于理解,预测效果较好,缺点是对发生频率很低的事件预测效果不好。 6.8 知识发现 6.8.4 知识发现(数据挖掘)的方法 (5)科学发现。 科学发现是在实验环境下发现科学定律。 (6)遗传算法。 在求解过程中,通过最好解的选择和彼此组合,使期望解的集合愈来愈好。 3. 神经计算方法 4. 可视化方法 可视化(visualization)就是把数据、信息和知识转化为可视的表示形式的过程。 6.8 知识发现 6.8.5 数据挖掘的应用 银行 美国银行家协会(ABA)预测数据仓库和数据挖掘技术在美国商业银行的应用增长率是14.9%。 分析客户使用分销渠道的情况和分销渠道的容量 ;建立利润评测模型;客户关系优化;风险控制等 电子商务 网上商品推荐;个性化网页;自适应网站… 生物制药、基因研究 DNA序列查询和匹配;识别基因序列的共发生性 … 电信 欺诈甄别;客户流失… 保险、零售。。。。。。 6.8 知识发现 6.8.5 数据挖掘的应用 Debt10% of Income Debt=0% Good Credit Risks Bad Credit Risks Good Credit Risks Yes Yes Yes NO NO NO Income$40K Open Accn’t Add New Product Decrease Usage ??? Time 序列分析 Sequence Analysis 决策树 Decision Trees 倾向性分析 客户保留 客户生命周期管理 目标市场 价格弹性分析 6.8 知识发现 6.8.5 数据挖掘的应用 Q Q Q Q I I 1 2 3 4 5 6 factor 1 factor 2 factor n 神经网络 Neural Networks 聚类分析 Clustering 客户细分 市场细分 倾向性分析 客户保留 目标市场 欺诈检测 关联分析 Association 市场组合分析 套装产品分析 目录设计 交叉销售 6.8 知识发现 6.8.6 数据挖掘技术 数据挖掘任务分类 描述(Description):了解数据中潜在的规律 预言(Predication):用历史预测未来 数据挖掘技术 概念/类描述 关联规则分析 分类(预言) 聚类 序列模式 异常检测 6.8 知识发现 6.8.6 数据挖掘技术 1. 概
文档评论(0)