数据挖掘在国民体质测试中应用研究.docVIP

数据挖掘在国民体质测试中应用研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘在国民体质测试中应用研究

数据挖掘在国民体质测试中应用研究   摘要:本文运用决策树和关联规则数据挖掘算法对体质测试数据进行研究,用SQLServer BI Dev Studio数据挖掘服务建立体质水平与各单项指标的数据挖掘模型,发现影响体质水平的重要指标。研究表明,将决策树和关联规则综合运用于体质水平数据挖掘研究是有着显著作用。结果显示:影响青年人体质的是身体爆发力,影响中年人体质水平的是平衡能力,对老年人体质水平影响较大的是反应时和心肺功能。建议:为促进国民体质健康,应针对不同人群、不同性别采用不同体育锻炼方式。   关键词:数据挖掘;关联规则;决策树;体质测试   2016年10月25日,中共中央、国务院根据党的十八届五中全会战略部署,印发了《“健康中国2030规划纲要》。推进健康中国建设,是全面建成小康社会、基本实现社会主义现代化的重要基础,是全面提升中华民族健康素质、实现人民健康与经济社会协调发展的国家战略。未来15年,是推进健康中国建设的重要战略时期,社会、经济、科技快速发展将为健康领域可持续发展提供强大保障。   党和国家历来高度重视国民的体质健康,国民体质是一个国家健康发展的重要保障。从2000年起每5年进行的国民体质测试是落实《中华人民共和国体育法》和《全民健身计划》的重要工作。面对积累的大量的国民体质测试数据,运用传统的处理方法,很难对体质健康状况进行全面科学的评价和有效地决策。数据挖掘是在数据库中知识发现重要的一部分,而知识发现是将未加工的数据转换为有用的信息的过程,包括数据转换、数据预处理和挖掘后的数据分析。由于我国体质测试数据库积累了大量的数据,而数据挖掘工具软件在体育领域的研究不够深入,推广还有一定难度,多数文献为数据挖掘的探索研究和规模较少数据的研究。国内许多学者根据数据挖掘的基本原理,利用数据挖掘工具对现有的体质数据进行探索,乔克满等以上海市国民体质监测指标为研究对象,应用SQL Server 2005数据挖掘服务发现验证性规则、含有新知识的规则和看似“不合理”的?则。张崇林等用Clementine12.0数据挖掘软件,发现高校教职工体质总评与各单项指标关联规则,发现对青年教职工和中年教职工体质影响较大的单项指标略有不同。数据挖掘在国民体质测试中的运用可见一斑。本文运用决策树和关联规则数据挖掘算法对体质测试数据进行研究,用SQL Server BIDev Studio数据挖掘服务建立体质水平与各单项指标的数据挖掘模型,发现影响体质水平的重要指标。   1研究对象与方法   1.1研究对象   研究对象为焦作市14243名成年人(20~84岁),其中焦作市区3161人,博爱县2052人,孟州市3870人,沁阳市1201人,温县2039人,武陟县1919人。体质测试由焦作市体育局专业人员于2015年8~11月完成。数据来源于河南省焦作市体育局2015年对焦作市市区及下属的沁阳市和5个县进行的体质测试。   1.2研究方法   1.2.1建立数据库用SQL Server 2008数据库软件建立焦作市体质测试数据库,其中每个人由若干体质测试项目构成,包括姓名、性别、年龄、身高、体重、身高体重指数、肺活量、台阶指数、体前屈、单脚站立、反应时、握力、纵跳、仰卧起坐,每个测试对象有唯一标识符(TID)。   1.2.2数学建模实验通过用SQL Server 2008Business Intelligence Development Studio (BI DevStudio)和Visual Studio 2010软件,包括数据分析服务SQL Server analysis service(SSAS),数据集成服务SQL Server Integration Services(SSIS)建立关联规则数据挖掘模型和决策树模型。   1.2.3频繁项集和关联规则设D是焦作市体质测试数据库I=I1,I2,…IM}是数据库内各项的集合,事务T是非空项集。   同时满足最小支持度阈值(min_sup)和最小置信度阈值(rain_conf)的规则称为强规则。如果项集,的相对支持度满足预定义的min_sup,则I是频繁项集。   1.2.4决策树归纳决策树是一种类似于流程图的树形结构,该方法利用信息增益寻找体质数据库中具有最大信息的属性,建立决策树的一个节点,每个内部节点表示一个属性上的测试,再根据该属性的取值建立树的分枝,每个分枝代表该树的一个输出,每个叶节点存放一个类标号。用决策树确定一组数据是否属于特定的类型。从决策树的根节点到叶节点的一条路径就对应着一条规则,整棵树就对应着一组规则。决策树与关联规则具有异曲同工之妙,为结合关联规则进行数据挖掘提供了条件。   决策树方法应用于国民体质测试中的基本思路是通过决策树方法

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档