- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
NBA东西联盟数据综合分析——以2019-2020赛季为例
内容摘要:纵观NBA历史,东部,西部两大联盟的各方面数据的较量始终让人津津乐道,人们站在各自的立场上争论着这两大联盟孰强孰弱。经过了因子分析、K-means聚类以及双样本等方差的t检验得出NBA在2019-2020赛季中西强东弱的局面依然没有改变。
关键词:NBA因子分析聚类分析对比研究
引言
纵观NBA历史,东部,西部两大联盟的各方面数据的较量始终让人津津乐道,人们站在各自的立场上争论着这两大联盟孰强孰弱。本文将基于2019-2020最新赛季对NBA多元数据进行综合分析。
目前国内外学术界对东西部两大联盟的分析具有代表性的研究有:陈瑾榕,李华,张雪峰论文《对NBA联盟西强东弱格局的探讨》[1]从整体上对目前西强东弱的局面进行探究。沈辉论文《美国NBA与地理》[2]对以地理为视角对NBA进行比较研究文世雄,王新雷,张晓丽,张钰羚论文《2016-2017赛季NBA东、西部决赛球队传球技术应用特征分析》[3]就传球技术对NBA东西联盟进行微观研究。张凯,朱金焕论文《影响NBA东、西部球队得分能力的回归分析》[4]使用回归分析法进行分析。
综合来看现有学术成果都或集中于对微观层面如传球技术的分析,或集中于以较为宏观的地理视角进行分析。本文将从使用NBA中2019-2020的多元数据进行因子分析、聚类分析等,通过多元方法更好对东西联盟进行对比研究。
研究方法
1、因子分析是统计学界普遍使用的降维方法,若对其结果进行合理的旋转可得到诸多的解释。
因子分析的数学模型为:
公式1
其中,f表示因子,称为公共因子(commonfactor),我们将多余变量中的信息降维成为因子,达到降维的目的,a称为x在因子f上的载荷(loading),它反映了因子f对变量x的重要性,ε是x;不能被四个公共因子解释的部分,称之为误差或特殊因子(specificfactor)。此外设为该行的变量共同度。反映全部公共因子变量对原有变量的总方差解释说明比例。该值越大说明因子分析丢失的信息越低。
K-means聚类分析,K-means聚类法通常有3个步骤
(1)选择k个样品作为初始凝聚点,或者将所有样品分成k个初始类,然后将这k个类的重心(均值)作为初始凝聚点。
(2)对所有的样品逐个归类,将每个样品归入凝聚点离它最近的那个类(通常采用欧氏距
离),该类的凝聚点更新为这一类目前的均值,直至所有样品都归了类。
重复步骤(2),直至所有的样品都不能再分配为止。
样本选择
本文的样本来自NBA中国官网/覆盖了东西两联盟全部的队伍。
实证分析
首先对数据进行因子分析,这里我们使用主成分因子分解法,因子数为3,旋转方法为最大方差法,当因子数为3时候得出变量共同度为83.574%说明选择因子数为3时即达到降维的目标又保留了足量的信息。
我们发现因子一当中篮板、投射、命中、得分四项的载荷较高,我们将其称之为进攻综合因子,该值越高说明该队伍在场上的攻击性越强。因子2称之为犯规综合因子,该值越高说明该队伍的犯规率较高。因子三称之为球权控制综合因子,该值越高说明该队对对方的抢断越多,球权控制也越多。
旋转的因子载荷
因子1
因子2
因子3
篮板
0.764738
-0.299023
0.345148
投射
0.687043
0.350512
0.29139
命中
0.901867
0.064235
0.044575
犯规
0.1166
0.954882
0.145312
得分
0.883445
0.218291
0.077089
抢断
0.27033
0.138684
0.959837
对所有球队进行得分计算并将上述结论使用进行聚类分析。首先先要确定聚类数K如图3使用CCC算法发现2为最佳聚类数。
我们将聚类的均值进行分析如下发现、第一组的特性为进攻性较强、球权控制力较强、同时犯规率也较高。故将第一组称之为强组,第二组的特性为进攻性较弱、球权控制力较弱、同时犯规率也较低。故将第二组称之为弱组。
聚类均值
聚类
进攻综合因子
犯规综合因子
球权控制综合因子
1
0002
-0.6307252
-0.472953
-0.2313432
最后分析强队、弱队是否与东西联盟有影响。我们将强队标记为1、弱队标记为0进行t检验我们发现最终的结果如表8为P=0.0692在显著性水平为0.1的情况下拒绝原假设说明强弱队确实和东西部联盟有关,并且我们发现东部联盟较弱、西部联盟较强。
五、结论
笔者经过了因子分析、K-means聚类以及双样本等方差的t检验得出NBA在2019-2020赛季中西强东弱的局面依然没有改变。从经济学上可以使用马太效应进行解释,更强的
文档评论(0)