球队数据挖掘实训论文.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于因子分析的影响NBA热火队上赛季 i=i 成绩的几个主要因素的数据挖掘 摘要:该文首先简介了因子分析理论及分析步骤,然后举例说明如何使用SPSS 统计软件对NBA热火队上赛季成绩是进行因子分析,分析数据,挖掘出球队的 潜在能力,从而帮助球队在以后的比赛中取得更好的成绩。 一、 弓I言 球队成绩分析是整个比赛过程的一个重要环节。它对于教练来说是一件必须 要做的事情,但是它也是一件复杂的事情。每个赛季教练都能获得很多球队和队 员的数据,那么我们该如何从这些数据中获得对比赛有用的信息呢?我们该怎样 从这些数据中挖掘出球队的潜在能力呢?因子分析是研究如何以最少的信息的 丢失,将众多的原始变量浓缩成少数几个因子变量,以及如何使因子变量具有较 强的解释性的一种多元统计分析方法。也就是说利用少数的几个公共因子,即挖 掘出数据的共性,去解释较多需观测的变量中存在的复杂关系。因此我们可以利 用因子分析方法的这一特性来分析球队的各项数据,找出少数隐含的公共因子来 解释球队的各项数据,进而分析球队的潜在能力。SPSS是世界上最早的,也是 目前最好的统计软件,所以我们使用SPSS这一统计软件来对球队成绩进行因子 分析。 二、 因子分析 我们观测的变量之间往往存在相关性,那么变量之间为何会有相关性呢?这 是因为往往有一些共同的因子支配着这些相关的变量。例如,随着年龄的增长, 儿童的身高、体重会随着变化,具有一定的相关性;身高和体重之间为何会有相 关性呢?因为存在着一个同时支配或影响着身高与体重的生长因子。那么,我们 能否通过对多个变量的相关系数矩阵的研究,找出同时影响或支配所有变量的共 性因子呢?因子分析就是从大量的数据中“由表及里”、“去粗取精”,寻找影 响或支配变量的多元统计方法。因子分析正是基于信息损失最小化而提出的一种 非常有效的方法。它把众多的指标综合成几个为数较少的指标,这些指标即因子 指标。因子的特点是:第一,因子变量的数量远远少于原始变量的个数;第二, 因子变量并非原始变量的简单取舍,而是一种新的综合;第三,因子变量之间没 有线性关系;第四,因子变量具有明明解释性,可以最大限度地发挥专业分析的 作用。因子分析是把每个原始变量分解成两个部分:一部分是由所有变量共同具 有的少数几个因子构成的,即所谓公共因子;另一部分是仅对某一个变量产生影 响,为某一个变量所特有的,即所谓特殊因子。 基于这样的假设,相应的因子模型为:设有p个气,七,…,X为可观测的随 机变量,每个变量可作如下分解: X =M F +人 F + +人 F + 8 1 11 1 12 2 1 m m 1 X =M F +M F + ... +人 F + 8 X =人彳.+人 F + +人 F +8 上式为因子模型,其中F , F,…,F为公共因子,8, 8 ,…,8为特殊因 12 m 12 p 子,人(i=1~p,j=1~m)为因子载荷;数学上可以证明,因子载荷人就是第i变量 与第j因子的相关系数,反映了第i变量在第j因子上的重要性。在因子模型 中,公共因子F , F,…,F之间互不相关,特殊因子8 , 8 ,…,8之间互不相关, 1 2 m 1 2 p 都是独立的,相互之间是没有关的。特殊因子与公共因子互不相关。特殊因子与 被测原始变量相关。因子载荷人 表示了公共因子f对第i个变量入的影响程 度,即入对F.的依赖程度。它是变量入在公共因子F 上的载荷量。所以因子 分析是如何从一组原始的观测变量出发,分析出公共因子和特殊因子,并求出相 应的载荷矩阵,进而解释各个公共因子的含义。即用于寻找表示这种潜在能力因 子的统计方法。 因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量 进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题 展开的。因子分析常常有以下四个基本步骤:(1)确认待分析的原有干变量是 否适合作因子分析。(2)构造因子变量。(3)利用旋转方法使因子变量更具有 可解释性。(4)计算因子变量得分。 三、应用SPSS统计软件来分析NBA热火队的上赛季季后赛成绩 现使用NBA热火队的上赛季季后赛21场比赛中篮板、助攻、失误、抢断、 盖帽、犯规6项数据使用SPSS统计软件进行分析,将篮板、助攻、失误、抢断、 盖帽、犯规作为六个变量,也就是因子模型中的可观测的随机变量 X , X , X , X , X , X,具体步骤是: 1 2 3 4 5 6 1、在SPSS中将数据输入表中。 2、按Analyze —Data Reduction—Factor顺序点击菜单项,打开Factor对话框。 3、在对话框中指定分析变量。 将如下数据选入右面框中: 4、 点击Extraction...按钮,出现对话框,选择主成分提取法。 5、 点击对话框Rota

文档评论(0)

ld555666 + 关注
实名认证
文档贡献者

小小鹏鹏

1亿VIP精品文档

相关文档