一种基于聚类和相关性分析NBA球员评价方法.docVIP

一种基于聚类和相关性分析NBA球员评价方法.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于聚类和相关性分析NBA球员评价方法

一种基于聚类和相关性分析的NBA球员评价方法   【摘要】本文提出了一种基于聚类和模糊决策的综合评价方法,利用k均值算法对评价样本进行初步分类,并对初步分类结果选取有价值的分类使用模糊决策进行进一步分析从而对该类样本进行评价.   【关键词】k均值;灰度预测;相关性分析;综合评价   聚类分析技术是数据挖掘技术的重要内容之一,聚类分析可以将样本集合中相似度高的个体聚合为一类,在样本处理阶段可以将样本预先分类以降低需要分析的样本集合容量.关联度分析方法可以根据因素之间发展态势的相似或相异程度来衡量因素间关联的程度.   本文给出了一种基于聚类和关联度分析的综合评价方法,解决无后验知识情况下对无差别数据样本进行分组评价的问题.最后以NBA球员为例给出仿真结果和分析.   一、综合评价方法设计   针对NBA球员的评价方法主要依据出场率,投篮命中率,得分等技术要素进行评估,但由于在对NBA球员进行综合分析时评价方式受到球员所处位置等因素限制,且各项要素间关联复杂无法定量描述使得综合评价模型难以建立.   聚类分析作为无指导学习的典型代表,能够按照特定标准对数据集进行合理划分,确定每个对象所属类别,从而将球员整体集合这个复杂数据集合分为由相似个体组成的多个个体集合,简化了问题复杂性.   (一)K均值聚类分析   设待分析的球员数据样本集X为n×m的矩阵,n为样本个数,m为特征数量,分类数为k,分类特征集Q={Q1,Q2,…,Qk},样本间距离d为任意两个体样本间的欧氏距离,类归属矩阵W规模为n×k.K均值聚类解决问题为找到一个类归属矩阵W最小化类平方误差总和   P(W,Q)=∑kl=1∑ni=1wi,ld(Xi,Ql).   同时需满足   ∑kl=1wi,l=1,1≤i≤n,   wi,l∈{0,1},1≤i≤n,1≤l≤k.   其中,对每个wi,t需计算   wi,t=1 if d(Xi,Ql)≤d(Xi,Qt),for 1≤t≤k,   wi,t=0 for t≠l.   解决以上问题可以以下方法?f归解决.   1.选取初始的类特征向量集合Q0然后针对Q0计算得到W0.记步数t=0.   2.W=Wt依照以下方法计算Qt+1.   ql,j=∑ni=1wi,lxi,j∑ni=1wi,l.   如果此时P(Wt,Q)=P(W,Qt+1),则W,Qt为类归属矩阵和类特征向量集,否则进行第3步.   3.Q=Qt+1,然后针对Q计算Wt+1.如果P(Wt,Q)=P(Wt+1,Q)或步数t超过给定迭代次数T,则Wt,Q为类归属矩阵和类特征向量集;否则步数t=t+1然后继续第2步.   通过聚类分析,样本集被划分为k类特征集合为Q的数据子集,可通过q来观测不同类别赝本集合的特征,选取需要的样本子集进行进一步分析.同样可作为同类优选的第一步.   (二)基于相关度分析   在进行模糊决策前需要对样本中该分类的各要素进行相关性分析以确定每个要素的权重因子.   1.相关性分析   由主观给定的权重因子通常在通用性和可靠性上存在问题,因此,本文通过对样本特征进行相关性分析来确定各特征的权重因子.   针对不同类别(位置)的NBA球员,可以选取历年公认该类别(位置)的最佳球员数据作为参考序列.   (a0(1),a0(2),…,a0(n)),   则相应选取的m个特征序列为   (am(1),am(2),…,am(n)),m≥1.   则ai与参考序列a0在k球员身上体现的关联系数ξi(k)计算方式如下:   ξi(k)=minr mins|x0(s)-xr(s)|+ρmaxr maxr|x0(s)-xr(s)||x0(s)-xr(s)|+ρmaxr maxs|x0(s)-xr(s)|,   ri=∑nk=1ξi(k)n.   称ri为序列ai对a0的关联度.其中分辨系数ρ∈[0,1],本文取ρ=0.5.   2.基于关联度的评价方法   根据1给出的针对各特征与评价结果的关联度ri,可做如下变换得到该类球员的评价得分:   G=∑mi=1(xi×ri).   二、应用与评估   (一)数据说明   本文数据采用新浪NBA数据库2016―2017赛季数据.   为避免数值差异性造成不同特征对距离影响不同,对目标数据做如下归一化变换:   a(1)≠0,f(a(k))=a(k)a(1)=b(k).   (二)聚类分析   综合得分,篮板等数据,可以推断第2类和第9类数据为优秀球员类.以出场率和得分能力为主要考虑对象,选取第9类为例进行进一步分析.   (三)基于相关度评价   1.相关性分析   选取11―16年五个赛季的MVP球员数据作为参考

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档