- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计实务
tatistical Practice
编者按 近期一些读者来信询问,什么是统计建模和统
计建模大赛,统计建模大赛的内容是什么,一些大的企业 团体也想寻其新知,并着手组织相关活动。本期荣智的文 章就此问题作了解答。
何谓统计建模和统计建模大赛
◎ 荣 智
国家统计局于2008年开展了面
向全国政府统计系统的职业技能竞赛 活动——统计建模大赛,各省、自治 区、直辖市统计局、调查总队及国家 统计局机关纷纷组队参加比赛。大赛 对于提高统计队伍的职业素养和专业 能力,培养统计工作者的创新精神、 团队意识,塑造积极进取、团结合作 的统计文化具有重要意义。
■ 一、什么是统计建模
统计建模是以计算机统计分析软 件为工具,利用各种统计分析方法对 批量数据建立统计模型和探索处理的 过程,用于揭示数据背后的因素,诠 释社会经济现象,或对经济和社会发 展做出预测或判断。随着计算机和网 络技术的快速普及和广泛发展,我们 面对着数据和信息爆炸的挑战,如何 迅速有效地将数据提升为信息、知识 和智能,是统计工作者面临的重要课 题。而统计建模将统计方法、计算机 技术完美结合,带动以数据分析为导 向的统计思维,发现和挖掘数据背后 的规律,为经济社会的发展提供更好 更多的统计信息。
大赛题目一般来源于社会、经济 和管理科学等方面经过适当简化加工
的实际问题,不要求参赛者预先掌握
深入的专门知识,只需要学过统计专 业的基本内容,较为熟练地掌握统计 分析方法,并且具备一定的统计工作 经验。题目有较大的灵活性供参赛者 发挥其创造能力。参赛者应根据题目 要求,完成一篇包括模型的假设、建 立和求解、计算方法的设计及计算机 实现、结果的分析和检验、模型的改 进等方面的论文(即答卷)。大赛评 奖以假设的合理性、建模的创造性、 结果的正确性和文字表述的清晰程度 为主要标准。
我们从下面一个例子,看一看什 么是统计建模。
案例:从交通事故数据能够得到 什么结论?
基本数据:各省市自治区改革开 放以来的交通事故数据。数据应该包 括机动车(货运,大客车、小轿车、 农用车、拖拉机、各种摩托车和工程 车等)、非机动车(自行车、三轮 车)、其他(如电动、助力自行车和 机动三轮车,虽然可能非法)、残疾 人车、兽力车、行人等等;数据也应 该包括事故等级,事故个数、死亡人 数、财产损失、受伤人数等;肇事者 的职业、年龄、驾龄、教育程度、是 否酒后驾车(很重要!)、是否疲劳
驾车、是否打手机、车速、路况(街
道、普通公路、等级公路、高速公 路)、事故时间段等等(这些都是交 管部门的标准记录)。数据应该覆盖 至少10年(最好有月度数据)。
附加数据:各省市自治区相应 年份的经济资料,包括各种道路的里 程、各种机动车的保有数等。
问题:
1.找出各种车辆的各种事故的概 率(及影响因素)、这些事故数量的 影响变量(比如年龄因素、是否喝 酒、山区或闹市区、时间段、何种道 路、车辆种类,等等)。
2.找出在什么因素(变量)下最 容易出事、什么因素(变量)下最容 易造成重大人身伤害、什么因素(变 量)造成财产损失最大。
3.找出各省市自治区事故的各自 特点,并且按照事故模式把各省市自 治区分类,同时按照经济分类进行比 较。说明交通事故与经济发展之间的 关系。
4.找出各地和全国事故的趋势, 以及这些趋势与经济(包括道路里 程、机动车数量等)之间的关系。并 且对未来事故进行预测。
5.对各省市自治区,根据各种与 交通事故相关的变量进行排序。
42 数据 2008.11
统计实务
tatistical Practice
要求:一切根据数据。任何所
采用的统计方法要说明条件和假定。 任何输出的结果要有说明和解释。
根据上述案例,不难形成这样 一个判断:在一定意义上,统计建模 是一种命题作文,它有以下几个特 点:
一是统计建模从经济社会发展 的实际情况出发,找出事物发展的趋 势和规律,如果脱离了这一点,统计 建模也就失去了意义。
二是统计建模从数据出发,找 出数据之间的联系,用数据说话,数 据是统计建模最大的特质。
三是统计建模将统计分析方法 和计算机技术有效结合,包括收集数 据、利用统计分析软件对数据进行分 析等。
四是统计建模涉及数据收集、 整理、分析等方面,对建模者的能力 要求较为全面。
■ 二、竞赛中的常见题型
赛题题型通常包括三个部分:
实际问题背景
问题可以是社会、经济、管 理、生活、环境、自然现象、工程技 术方面的问题,也可以是现代科学中 出现的新问题。任何问题都可以成为 统计建模的问题。
若干假设条件
有如下几种情况:
1.只有过程、规则等定性假设, 无具体定量数据;
2.给出若干实测或统计数据;
3.给出若干参数或图形;
4.蕴涵着某些机动、可发挥的补 充假设条件,参
文档评论(0)