第八组数据挖掘摘要.ppt

第八组数据挖掘摘要

(3) 聚类   数据库中的记录可被化分为一系列有意义的子集,即聚类。例如:将申请人分为高度风险申请者、中度风险申请者、低度风险申请者。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。 聚类技术主要包括传统的模式识别方法和数学分类学。80年代初,Mchalski提出了概念聚类技术,其要点是,在划分对象时不仅考虑对象之间的距离,还要求划分出的类具有某种内涵描述,从而避免了传统技术的某些片面性。例如:市场销售: 帮助市场人员发现客户中的不同群体,然后用这些知识来开展一个目标明确的市场计划;保险公司: 对购买了汽车保险的客户,标识那些有较高平均赔偿成本的客户; (4)分类 按照分析对象的属性、特征,建立不同组来描述事物。例如银行部门根据以前的数据将客户分成了不同类别,现在就可以根据这些来区分新申请贷款的客户,以采取相应的贷款方案。 例如:把客户分为高风险客户和低风险客户 (5) 预测   把握分析对象的发展规律,对未来的趋势做出预见。数据挖掘自动在大型数据库中寻找预测性数据,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。 一个典型的例子:市场预测问题。数据挖掘使用过去有关促销的数据来寻找未来投资中回报最大的用户,其它可预测的问题包括预报破产以及认定对指定事件最可能作出反应的群体。(例如,股票。从报表等预

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档