第二章 統计数据.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 統计数据

第二章 统计数据;第一节 统计数据的数据与种类;(二)说明总体单位特征的概念称为标志,如性别、考试成绩都是说明个别人的特征的标志。; (三)统计指标 说明总体特征的概念与具体数字称为指标。如我国2002年国内生产总值102398亿元,按可比价格计算,比上年增长8%,年末全国就业人员73740万人等都是统计指标。说明总体数量特征特征的数据,主要产生于统计整理和分析阶段,是综合数据。 ; 二、统计数据的种类 ;[补充] 统计数据的计量层次;定类数据;定序数据;定量数据;第二节 统计数据搜集; 一、统计数据搜集的意义;(三)对统计调查的要求; 二、统计调查方案; 调查单位要与调查的填报单位或报告单位相区别。 填报单位: 向上报告调查内容、提交统计数据的单位。它可能与调查单位一致,也可能不一致。如调查工业生产情况(目的),所有的工业企业是总体(对象),每一个工业企业是调查单位,同时每一个工业企业也是填报单位;而调查工业生产设备情况,所有的工业生产设备是调查对象,每一台设备是调查单位,每一个工业企业是填报单位。; (三)确定调查项目 调查项目是具体的调查内容,是调查单位具有的特征,由一系列品质标志和数量标志构成。为了便于调查和汇总,应该把调查项目按一定顺序排列在表格中,这就是调查表。一个调查单位填写一份的调查表称为单一表,若干个调查单位填写一份的调查表称为一揽表。 (四)确定调查方式方法;(五)确定调查时间 确定调查时间一是指确定标准时间,即调查资料所属的时间,一是指确定调查工作的起止时间。对时期现象,标准时间是一段时间,如2003年第三产业营业收入调查,标准时间是2003年1月1日至2003年12月31日,调查工作时间是2004年1月1日至1月31日;对时点现象,标准时间是某一时刻,如第五次人口普查的标准时间是2000年11月1日零点,调查工作时间是2000年11月1日至10日。 (六)确定其它事项 包括确定调查机构、培训计划、是否需要试点、经费预算、资料报送程序和方法、数据公布时间等。;二、统计调查的方式;(一)统计报表   概念、优点、局限性 (二)普查   作用:调查内容详细、提供重要国情国力资料;提供抽样框。   特点:必须规定标准时间、统一进行、基本内容和指标解释统一并相对稳定。 ;2、非全面调查;三种非全面调查的比较;(六)我国统计调查方法体系改革的目标模式 ;四、统计数据的质量 ;一、统计整理的意义和步骤 二、统计分组 三、分布数列 四、统计表 五、次数分布图和类型 ;2000网易杯全国大学生数学建模竞赛 DNA序列分类 2000年6月,人类基因组计划中DNA全序列草图完成,预计2001年可以完成精确的全序列图,此后人类将拥有一本记录着自身生老病死及遗传进化的全部信息的“天书”。这本大自然写成的“天书”是由4个字符A,T,C,G按一定顺序排成的长约30亿的序列,其中没有“断句”也没有标点符号,除了这4个字符表示4种碱基以外,人们对它包含的“内容”知之甚少,难以读懂。破译这部世界上最巨量信息的“天书”是二十一世纪最重要的任务之一。在这个目标中,研究DNA全序列具有什么结构,由这4个字符排成的看似随机的序列中隐藏着什么规律,又是解读这部天书的基础,是生物信息学(Bioinformatics)最重要的课题之一。 ;虽然人类对这部“天书”知之甚少,但也发现了DNA序列中的一些规律性和结构。例如,在全序列中有一些是用于编码蛋白质的序列片段,即由这4个字符组成的64种不同的3字符串,其中大多数用于编码构成蛋白质的20种氨基酸。又例如,在不用于编码蛋白质的序列片段中,A和T的含量特别多些,于是以某些碱基特别丰富作为特征去研究DNA序列的结构也取得了一些结果。此外,利用统计的方法还发现序列的某些片段之间具有相关性,等等。这些发现让人们相信,DNA序列中存在着局部的和全局性的结构,充分发掘序列的结构对理解DNA全序列是十分有意义的。目前在这项研究中最普通的思想是省略序列的某些细节,突出特征,然后将其表示成适当的数学对象。;这种被称为粗粒化和模型化的方法往往有助于研究规律性和结构。 作为研究DNA序列的结构的尝试,提出以下对序列集合进行分类的问题: 1)下面有20个已知类别的人工制造的序列(见下页),其中序列标号1—10 为A类,11-20为B类。请从中提取特征,构造分类方法,并用这些已知类别的序列,衡量你的方法是否足够好。然后用你认为满意的方法,对另外20个未标明类别的人工序列(标号21—40)进行分类,把结果用序号(按从小到大的顺序)标明它们的类别(无法分类的不写入): A类 ; B类

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档