第二章統计数据.pptVIP

下载本文档

13
0
约1.61万字
约 192页
2017-04-24 发布于上海
举报
版权申诉

第二章統计数据.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第二章統计数据

第二章统计数据;第一节统计数据的数据与种类;（二）说明总体单位特征的概念称为标志，如性别、考试成绩都是说明个别人的特征的标志。; （三）统计指标说明总体特征的概念与具体数字称为指标。如我国2002年国内生产总值102398亿元，按可比价格计算，比上年增长8%，年末全国就业人员73740万人等都是统计指标。说明总体数量特征特征的数据，主要产生于统计整理和分析阶段，是综合数据。 ; 二、统计数据的种类 ;[补充] 统计数据的计量层次;定类数据;定序数据;定量数据;第二节统计数据搜集; 一、统计数据搜集的意义;（三）对统计调查的要求; 二、统计调查方案; 调查单位要与调查的填报单位或报告单位相区别。填报单位: 向上报告调查内容、提交统计数据的单位。它可能与调查单位一致，也可能不一致。如调查工业生产情况（目的），所有的工业企业是总体（对象），每一个工业企业是调查单位，同时每一个工业企业也是填报单位；而调查工业生产设备情况，所有的工业生产设备是调查对象，每一台设备是调查单位，每一个工业企业是填报单位。; （三）确定调查项目调查项目是具体的调查内容，是调查单位具有的特征，由一系列品质标志和数量标志构成。为了便于调查和汇总，应该把调查项目按一定顺序排列在表格中，这就是调查表。一个调查单位填写一份的调查表称为单一表，若干个调查单位填写一份的调查表称为一揽表。（四）确定调查方式方法;（五）确定调查时间确定调查时间一是指确定标准时间，即调查资料所属的时间，一是指确定调查工作的起止时间。对时期现象，标准时间是一段时间，如2003年第三产业营业收入调查，标准时间是2003年1月1日至2003年12月31日，调查工作时间是2004年1月1日至1月31日；对时点现象，标准时间是某一时刻，如第五次人口普查的标准时间是2000年11月1日零点，调查工作时间是2000年11月1日至10日。（六）确定其它事项包括确定调查机构、培训计划、是否需要试点、经费预算、资料报送程序和方法、数据公布时间等。;二、统计调查的方式;（一）统计报表　　概念、优点、局限性（二）普查　　作用：调查内容详细、提供重要国情国力资料;提供抽样框。　　特点：必须规定标准时间、统一进行、基本内容和指标解释统一并相对稳定。 ;2、非全面调查;三种非全面调查的比较;（六）我国统计调查方法体系改革的目标模式 ;四、统计数据的质量;一、统计整理的意义和步骤二、统计分组三、分布数列四、统计表五、次数分布图和类型 ;2000网易杯全国大学生数学建模竞赛 DNA序列分类 2000年6月，人类基因组计划中DNA全序列草图完成，预计2001年可以完成精确的全序列图，此后人类将拥有一本记录着自身生老病死及遗传进化的全部信息的“天书”。这本大自然写成的“天书”是由4个字符A，T，C，G按一定顺序排成的长约30亿的序列，其中没有“断句”也没有标点符号，除了这4个字符表示4种碱基以外，人们对它包含的“内容”知之甚少，难以读懂。破译这部世界上最巨量信息的“天书”是二十一世纪最重要的任务之一。在这个目标中，研究DNA全序列具有什么结构，由这4个字符排成的看似随机的序列中隐藏着什么规律，又是解读这部天书的基础，是生物信息学（Bioinformatics）最重要的课题之一。 ;虽然人类对这部“天书”知之甚少，但也发现了DNA序列中的一些规律性和结构。例如，在全序列中有一些是用于编码蛋白质的序列片段，即由这4个字符组成的64种不同的3字符串，其中大多数用于编码构成蛋白质的20种氨基酸。又例如，在不用于编码蛋白质的序列片段中，A和T的含量特别多些，于是以某些碱基特别丰富作为特征去研究DNA序列的结构也取得了一些结果。此外，利用统计的方法还发现序列的某些片段之间具有相关性，等等。这些发现让人们相信，DNA序列中存在着局部的和全局性的结构，充分发掘序列的结构对理解DNA全序列是十分有意义的。目前在这项研究中最普通的思想是省略序列的某些细节，突出特征，然后将其表示成适当的数学对象。;这种被称为粗粒化和模型化的方法往往有助于研究规律性和结构。作为研究DNA序列的结构的尝试，提出以下对序列集合进行分类的问题： 1）下面有20个已知类别的人工制造的序列（见下页），其中序列标号1—10 为A类，11-20为B类。请从中提取特征，构造分类方法，并用这些已知类别的序列，衡量你的方法是否足够好。然后用你认为满意的方法，对另外20个未标明类别的人工序列（标号21—40）进行分类，把结果用序号（按从小到大的顺序）标明它们的类别（无法分类的不写入）： A类； B类

您可能关注的文档

文档评论（0）

1234554321 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第二章統计数据.pptVIP