NBA东西联盟数据综合分析——以2019-2020赛季为例.doc

NBA东西联盟数据综合分析——以2019-2020赛季为例.doc

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

NBA东西联盟数据综合分析——以2019-2020赛季为例

内容摘要:纵观NBA历史,东部,西部两大联盟的各方面数据的较量始终让人津津乐道,人们站在各自的立场上争论着这两大联盟孰强孰弱。经过了因子分析、K-means聚类以及双样本等方差的t检验得出NBA在2019-2020赛季中西强东弱的局面依然没有改变。

关键词:NBA因子分析聚类分析对比研究

引言

纵观NBA历史,东部,西部两大联盟的各方面数据的较量始终让人津津乐道,人们站在各自的立场上争论着这两大联盟孰强孰弱。本文将基于2019-2020最新赛季对NBA多元数据进行综合分析。

目前国内外学术界对东西部两大联盟的分析具有代表性的研究有:陈瑾榕,李华,张雪峰论文《对NBA联盟西强东弱格局的探讨》[1]从整体上对目前西强东弱的局面进行探究。沈辉论文《美国NBA与地理》[2]对以地理为视角对NBA进行比较研究文世雄,王新雷,张晓丽,张钰羚论文《2016-2017赛季NBA东、西部决赛球队传球技术应用特征分析》[3]就传球技术对NBA东西联盟进行微观研究。张凯,朱金焕论文《影响NBA东、西部球队得分能力的回归分析》[4]使用回归分析法进行分析。

综合来看现有学术成果都或集中于对微观层面如传球技术的分析,或集中于以较为宏观的地理视角进行分析。本文将从使用NBA中2019-2020的多元数据进行因子分析、聚类分析等,通过多元方法更好对东西联盟进行对比研究。

研究方法

1、因子分析是统计学界普遍使用的降维方法,若对其结果进行合理的旋转可得到诸多的解释。

因子分析的数学模型为:

公式1

其中,f表示因子,称为公共因子(commonfactor),我们将多余变量中的信息降维成为因子,达到降维的目的,a称为x在因子f上的载荷(loading),它反映了因子f对变量x的重要性,ε是x;不能被四个公共因子解释的部分,称之为误差或特殊因子(specificfactor)。此外设为该行的变量共同度。反映全部公共因子变量对原有变量的总方差解释说明比例。该值越大说明因子分析丢失的信息越低。

K-means聚类分析,K-means聚类法通常有3个步骤

(1)选择k个样品作为初始凝聚点,或者将所有样品分成k个初始类,然后将这k个类的重心(均值)作为初始凝聚点。

(2)对所有的样品逐个归类,将每个样品归入凝聚点离它最近的那个类(通常采用欧氏距

离),该类的凝聚点更新为这一类目前的均值,直至所有样品都归了类。

重复步骤(2),直至所有的样品都不能再分配为止。

样本选择

本文的样本来自NBA中国官网/覆盖了东西两联盟全部的队伍。

实证分析

首先对数据进行因子分析,这里我们使用主成分因子分解法,因子数为3,旋转方法为最大方差法,当因子数为3时候得出变量共同度为83.574%说明选择因子数为3时即达到降维的目标又保留了足量的信息。

我们发现因子一当中篮板、投射、命中、得分四项的载荷较高,我们将其称之为进攻综合因子,该值越高说明该队伍在场上的攻击性越强。因子2称之为犯规综合因子,该值越高说明该队伍的犯规率较高。因子三称之为球权控制综合因子,该值越高说明该队对对方的抢断越多,球权控制也越多。

旋转的因子载荷

因子1

因子2

因子3

篮板

0.764738

-0.299023

0.345148

投射

0.687043

0.350512

0.29139

命中

0.901867

0.064235

0.044575

犯规

0.1166

0.954882

0.145312

得分

0.883445

0.218291

0.077089

抢断

0.27033

0.138684

0.959837

对所有球队进行得分计算并将上述结论使用进行聚类分析。首先先要确定聚类数K如图3使用CCC算法发现2为最佳聚类数。

我们将聚类的均值进行分析如下发现、第一组的特性为进攻性较强、球权控制力较强、同时犯规率也较高。故将第一组称之为强组,第二组的特性为进攻性较弱、球权控制力较弱、同时犯规率也较低。故将第二组称之为弱组。

聚类均值

聚类

进攻综合因子

犯规综合因子

球权控制综合因子

1

0002

-0.6307252

-0.472953

-0.2313432

最后分析强队、弱队是否与东西联盟有影响。我们将强队标记为1、弱队标记为0进行t检验我们发现最终的结果如表8为P=0.0692在显著性水平为0.1的情况下拒绝原假设说明强弱队确实和东西部联盟有关,并且我们发现东部联盟较弱、西部联盟较强。

五、结论

笔者经过了因子分析、K-means聚类以及双样本等方差的t检验得出NBA在2019-2020赛季中西强东弱的局面依然没有改变。从经济学上可以使用马太效应进行解释,更强的

文档评论(0)

159****1944 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档