- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
?
?
大数据视角下中国田径竞赛数据采集方法研究
?
?
魏鑫
摘要:当今时代,数据已成为国家基础性战略资源,党中央、国务院高度重视大数据发展及创新应用。不过,目前在体育中特别是田径领域中大数据还未展现出其應有的战略价值。其主要原因在于缺乏反映田径本质的大规模基础数据。我国现有的田径信息数据均不能满足大数据的相关要求。因此,建立符合大数据时代田径信息采集数据库事关重要。其实在田径领域中存在一个天然数据库:成绩册与秩序册。本研究将立足于大数据时代对数据采集的相关要求,构建一套基于竞赛端的以竞赛成绩信息为目标数据的采集方法体系。
关键词:大数据竞赛数据采集
:G806:A:2095-2813(2018)08(b)-0206-03
当今时代,数据已成为国家基础性战略资源,大数据正对全球经济运行机制、社会生活方式和国家管理能力产生重要影响。党中央、国务院高度重视大数据发展及创新应用,十八届五中全会明确提出实施国家大数据战略。国务院印发的《促进大数据发展行动纲要》指出,大数据已成为“提升政府管理能力的新途径”。这就要求各级管理部门树立大数据思维,借助大数据手段推动政府管理理念和社会治理模式进步。然而,当天的大数据仍属于新兴事物,在体育中的运用也仅仅在足球、网球、高尔夫、棒球等项目中,且主要进行技术选材训练等方面应用。针对更为宏观的竞技相关管理运用尚未展开,其主要原因在于缺乏大规模竞赛数据的获取方法。因此,本研究将在大数据视角下,以田径项目为例探究竞赛数据信息的全样本采集方法。
1目前我国体育数据库现状
高德纳咨询公司对大数据的定义是:大数据是全样本、大容量、高速度和形式多样的信息资产,它需要低成本的、形式创新的信息处理,以增强洞察力和辅助决策。但是,目前我国体育数据库主要存在以下几个问题。
1.1国家竞技体育信息数据库信息全面多样但覆盖面狭窄
国家竞技体育信息数据库主要包括运动成绩库、实时数据库、奥运实力分析库三个部分,收集参加全国以上级别比赛的运动员信息。尽管其内容齐全,但其对全体运动员覆盖比例估算约在2.7%。
1.2全国运动员注册信息数据库信息单一、覆盖面小、数据割裂
国家于2003年制定了《全国运动员注册与交流管理办法》,以杜绝和减少比赛中假年龄假资格等不良现象。但由于行政体制及重视程度的问题,经过14年发展当前我国的青少年运动员注册仅在省级以上比赛执行。且由于管理体质问题各省、教育部、国家体育总局数据相互分割,并且相当多的注册信息与成绩信息互相割裂,大大限制其作用价值。此外,由于其只涵盖参加省级以上比赛的运动员,仅占参加市级比赛总人数的23.8%,仍有近8成基层运动员并未统计。
1.3《体育事业统计年鉴》统计范围狭窄、无个人信息、信度较低
该信息采集是由低级训练单位一层层上报而来,由于现在运动员的多元化培养,培养单位由体育系统扩展到包括体育系统、教育系统、社会系统以及家庭系统的多种培养形式。以前的训练单位已经远远不能涵盖新增的后备运动员。此外,由于上报数据牵扯到经费发放,该数据公信力存疑,且无法锁定个人运动员与竞赛成绩。
综上所述,这些信息库均无法满足当前对大数据的定义要求,即无法做到全样本、高效快速的信息收集,对数据的采集处理需要消耗大量的人力物力与时间,且对于运动员微观数据的人群覆盖极为狭小。由于数据结果的时间延迟、覆盖面狭窄、缺乏精度,其辅助决策效果大打折扣。
2当前田径竞赛数据收集存在问题
我国竞技体育数据库有关田径项目(不仅仅是田径项目)的数据信息主要针对于顶层运动员,即能参加高级别比赛的运动员信息才会得到录入。这会导致几个问题:无法对全国整个田径训练情况进行把握,如有多少运动员,多少教练员等;无法对优秀运动员整个运动生涯进行时间序列的研究,录入的仅是其成绩达到一定水平后的信息;无法对全国青少年运动员状况进行把握;无法对基层教练员情况进行了解;整体数据以横截面为主,对大部分优秀运动员个体的记录无连续性,进而导致信息利用率较低,无法在相关预测方面进行深入分析。目前我国的竞技体育数据库包含的信息仅仅是一个金字塔的顶端,而支持金字塔矗立的基础,我们尚未掌握。当然,这是由于当时信息技术的限制,收集全国性的信息成本巨大,在当时进行全国性的信息采集是不现实的。但是,大数据时代的到来,使得进行全国性的信息采集成为可能。
为了解决我国竞技体育数据信息纪录过于狭窄的问题,将信息纪录对象向基础延伸是必须的。当前,随着体育信息化的发展,很多团队开发类似于“竞技体育数据管理平台”的软件,下放到各个训练单位进行信息收集,也就是将运动员、教练员信息收集放在训练单位端进行。使用上述方法进行全国性的信息采集会产生如下问题:(1)当前的信息平台除了进行运动员、教练员信息收集外,还设计了训练过程、办公自动化等一些列功能,整体
文档评论(0)