- 6
- 0
- 约6.91千字
- 约 15页
- 2018-10-17 发布于福建
- 举报
数据挖掘技术在体育科学的研究中的应用的现状评述
数据挖掘技术在体育科学的研究中的应用的现状评述
【摘要】通过整理体育科学领域数据挖掘方面的研究文献,利用体育统计的研究方法,把文献资料按照体育管理、比赛应用、训练应用、体育教学、综述、其他几个归类进行分析,结果发现当前的研究资料主要偏重于简单的理论分析,而对于体育相关领域数据库的建立和应用则相对较少,这也造成了结果片面或出现偏差。但是值得肯定的是,国内一些专家和学者已经开始把数据挖掘技术引入到体育项目中,虽然目前的研究还不够深入,但是这对于我们日后研究体育数据挖掘,真正把数据挖掘技术利用到体育技战术制定和体育发展决策,推进数据挖掘技术在体育领域的发展,具有重要意义。
【关键词】数据挖掘;体育科学研究;体育统计
引言
近年来,数据挖掘技术已成为计算机领域的研究热点,随着信息化技术在体育运动中的广泛运用,逐步收集了大量关于运动员成长和选材、训练和比赛等方面的真实有效数据,通过对数据进行整理和分析可得到隐藏的知识和规则,为服务于体育各领域的研究、运动员取得更好的成绩以及体育管理部门的决策和管理提供了有益帮助。
体育科学中拥有大量训练、教学和竞赛中的数据信息资源与体育统计,如何利用这些有效数据,发现潜在的可以利用的规律,是体育科学利用计算机技术亟须解决的问题之一,现有的数据挖掘技术能为此提供帮助,它是指从大型数据集中,挖掘隐含在其中的、人们事先不知道的、对决策有用的知识的过程,利用数据挖掘技术,在体育教学、体育训练和体育竞赛中可以提升其训练与服务水平,更好地满足各级各类体育科研工作者的需求。然而由于基础数据资料填报不够完善或准确,数据自身具有不确定性,数据仓库建模规模过于复杂,挖掘算法设计缺陷等原因,造成了挖掘结果失真,不能让教练员和管理人员完全信服,无法在实际的各环节中起到指导作用。
本文查阅近十年来关于体育数据挖掘方面的相关文献资料,从文献计量角度分析该领域的研究内容、存在问题、研究热点,分析数据挖掘技术在各个领域的研究现状,对数据挖掘技术的广泛应用情况进行客观的认识,促使相关部门利用这项技术发现数据中隐含的、有价值的规律,本文运用体育统计的研究方法,对当前数据技术研究的热点、技术瓶颈、研究领域和存在的问题进行分析。科学规范地对这些信息资源进行整合和集成,实现教育信息化、决策科学化和管理规范化。
1数据挖掘的定义
数据挖掘起源于从数据库中发现知识,它首次出现在1989年8月在底特律举行的第十一届国际联合人工智能学术会议上。在1996年出版的总结该领域进展的权威论文集《知识发现与数据进展》中,Fayyd、Piatetsky-Shapiro和smyth给出了知识发现和数据挖掘的最新定义,将二者加以区分〔1〕。
数据挖掘(Data Mining)的定义为:数据挖掘是知识发现中通过特定的算法在可接受的计算效率限制内生成特定模式的一个步骤。数据挖掘技术在技术上又有着这样的定义:从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程〔2〕。
数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。
数据挖掘的步骤会随不同领域的应用而有所变化,每一种数据挖掘技术也会有各自的特性和使用步骤,针对不同问题和需求所制定的数据挖掘过程也会存在差异。此外,数据的完整程度、专业人员支持的程度等都会对建立数据挖掘过程有所影响。这些因素造成了数据挖掘在各不同领域中的运用、规划,以及流程的差异性,即使同一产业,也会因为分析技术和专业知识的涉入程度不同而不同,因此对于数据挖掘过程的系统化、标准化就显得格外重要。如此一来,不仅可以较容易地跨领域应用,也可以结合不同的专业知识,发挥数据挖掘的真正精神。
2研究对象与方法
2.1研究对象
以体育相关领域数据挖掘的研究文献资料为研究对象。
2.2研究方法
本研究通过中国知网、维普数据库和万方数据库等平台,分别以数据挖掘和体育相关运动项目或比赛对1998-2014年的文献资料进行检索,以“数据挖掘”为关键词,并以“体育”为主题检索词进行检索,经筛选后得到96篇该主题相关文献,其中博士论文3篇,硕士论文17篇,核心期刊29篇,一般刊物及会议47篇。运用体育统计的研究方法,对相关文献进行分类和整理,进行定量综合的研究方法,目的是试图确定研究变量间关系的“真实”值。
研究的重点是对收集到的文章做特征编码,包括以下变量论文领域、期刊级别、发表时间、学历职称、研究方向、备注。
3数据检索分析
3.1年度数量分布统计
原创力文档

文档评论(0)