财经管理统计学与外汇管理知识分析.pptxVIP

  • 0
  • 0
  • 约5.18千字
  • 约 47页
  • 2021-05-12 发布于北京
  • 举报

财经管理统计学与外汇管理知识分析.pptx

统研会学术交流篇之——聚类方法(Clustering)演讲人: 上海财经大学统计学系 吕江平主讲内容聚类方法原理介绍案例分析(SAS/Enterprise Miner)推荐参考书目什么是聚类聚类(Clustering)就是将数据分组成为多个类(Cluster)。在同一个类内对象之间具有较高的相似度,不同类之间的对象差别较大。什么是聚类早在孩提时代,人就通过不断改进下意识中的聚类模式来学会如何区分猫和狗,动物和植物聚类分析无处不在谁经常光顾商店,谁买什么东西,买多少?按忠诚卡记录的光临次数、光临时间、性别、年龄、职业、购物种类、金额等变量分类这样商店可以….识别顾客购买模式(如喜欢一大早来买酸奶和鲜肉,习惯周末时一次性大采购)刻画不同的客户群的特征(用变量来刻画,就象刻画猫和狗的特征一样)什么情况下需要聚类为什么这样分类?因为每一个类别里面的人消费方式都不一样,需要针对不同的人群,制定不同的关系管理方式,以提高客户对公司商业活动的相应率。聚类分析无处不在挖掘有价值的客户,并制定相应的促销策略:如,对经常购买酸奶的客户对累计消费达到12个月的老客户针对潜在客户派发广告,比在大街上乱发传单命中率更高,成本更低!聚类分析无处不在谁是银行信用卡的黄金客户?利用储蓄额、刷卡消费金额、诚信度等变量对客户分类,找出“黄金客户”!这样银行可以……制定更吸引的服务,留住客户!比如:一定额度和期限的免息透资服务!百盛的贵宾打折卡!在他或她生日的时候送上一个小蛋糕!聚类的应用领域经济领域:帮助市场分析人员从客户数据库中发现不同的客户群,并且用购买模式来刻画不同的客户群的特征。谁喜欢打国际长途,在什么时间,打到那里?对住宅区进行聚类,确定自动提款机ATM的安放位置股票市场板块分析,找出最具活力的板块龙头股企业信用等级分类……生物学领域推导植物和动物的分类;对基因分类,获得对种群的认识数据挖掘领域作为其他数学算法的预处理步骤,获得数据分布状况,集中对特定的类做进一步的研究有贡献的研究领域数据挖掘聚类可伸缩性、各种各种复杂形状类的识别,高维聚类等统计学主要集中在基于距离的聚类分析,发现球状类机器学习无指导学习(聚类不依赖预先定义的类,不等同于分类)空间数据技术生物学市场营销学什么情况下需要聚类以上分析,没有大量的数据去支持,Data Mining就什么都挖不出来。大量的数据不等于大量的垃圾,我们需要针对客户市场细分所需要的资料。如需要知道白金持卡人和金卡持卡人的流动率,各自平均消费水平有多少,等;聚类分析可以辅助企业进行客户细分,但是Data mining的客户细分不等同于商业领域的细分,看不懂结果,也可能造成企业管理层无法对结果善加利用。聚类分析原理介绍聚类分析中“类”的特征:聚类所说的类不是事先给定的,而是根据数据的相似性和距离来划分聚类的数目和结构都没有事先假定聚类分析原理介绍聚类方法的目的是寻找数据中:潜在的自然分组结构a structure of “natural” grouping感兴趣的关系relationshipAKQJ聚类分析原理介绍什么是自然分组结构Natural grouping ?我们看看以下的例子:有16张牌如何将他们分为 一组一组的牌呢?AKQJ聚类分析原理介绍分成四组每组里花色相同组与组之间花色相异花色相同的牌为一副Individual suitsAKQJ聚类分析原理介绍分成四组符号相同的牌为一组符号相同的的牌Like face cardsAKQJ聚类分析原理介绍分成两组颜色相同的牌为一组颜色相同的配对Black and red suitsAKQJ聚类分析原理介绍分成两组大小程度相近的牌分到一组大配对和小配对Major and minor suitsAKQJ聚类分析原理介绍这个例子告诉我们,分组的意义在于我们怎么定义并度量“相似性”Similar因此衍生出一系列度量相似性的算法大配对和小配对Major and minor suits聚类分析原理介绍相似性Similar的度量(统计学角度)距离Q型聚类(主要讨论)主要用于对样本分类常用的距离有(只适用于具有间隔尺度变量的聚类):明考夫斯基距离(包括:绝对距离、欧式距离、切比雪夫距离)兰氏距离马氏距离斜交空间距离此不详述,有兴趣可参考《应用多元分析》(第二版)王学民相似系数R型聚类用于对变量分类,可以用变量之间的相似系数的变形如1-rij定义距离这里不详细介绍这种聚类度量方法聚类分析原理介绍变量按测量尺度(Measurement Level)分类间隔(Interval)尺度变量连续变量,如长度、重量、速度、温度等有序(Ordinal)尺度变量等级变量,不可加,但可比,如一等、二等、三等奖学金名义(Nominal)尺度变量类别变量,不可加也不可比,如性别、职业等当对象是同时被各种

文档评论(0)

1亿VIP精品文档

相关文档