数据统计分析-第一次作业.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
简答题: 1 什么是统计学?请结合自己的课题介绍统计学的内含 答:统计学是一门研究,以推断为特征的科学,“ 由部分推及全体”的思想贯穿于的始终。具 体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对 总体特征进行推断的原理和方法;是关于收集、整理、分析和解释统计数据的科学,是一门 认识方法论性质的科学,其目的是探索数据内在的数量规律性,以达到对客观事物的科学认 识。 我的研究课题是用生物信息学的方法来研究微卫星方面的问题。本课题的研究最初就是 用统计学的方法对不同基因组中的微卫星进行统计,分析微卫星与物种的相关性及联系。进 行本课题的研究,首先,收集数据,在 NCBI 中下载多条基因组数据,之后,根据生物不同 的特征,对数据进行分类及整理,接下来,运用统计学的相关概念比如相对密度、相对风度、 回归方程等进行基因组中微卫星的分布的计算,之后,运用 R 语言作图,将微卫星的分布 可视化,更深入地进行研究分析分布规律与生物功能及进化的联系。 2 举例说明总体,样本,参数,统计量,变量这几个概念 答:总体是包含所研究的全部个体(数据)的集合。 样本是从总体中抽取的一部分元素的集合。 参数是用来描述总体特征的概括性数字度量。 是用来描述样本特征的概括性数字度量。 变量是说明现象某种特征的概念。 比如欲调查某高校的2017 届研究生毕业生就业率情况,那么该高校的所有 2017 届研 究生毕业生则构成一个总体,其中的每一个研究生毕业生都是一个个体。 若从该高校的所有 2017 届研究生毕业生中按某种抽样规则抽出了 100 位毕业生,则这 100 位毕业生就构成了一个样本。 在这项调查中就业情况感兴趣,那么就业率就是一个变量。 通常关心某高校的 2017 届研究生毕业生平均就业率,这里这个平均值就是一个参数。 只有样本的有关就业率的数据,用此样本计算的平均值就是统计量。 3 比较概率抽样和非概率抽样的特点,指出各自适用情况 答:概率抽样:抽样时按一定的概率以随机原则抽取样本。每个单位别抽中的概率已知或 可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽到的概率。技术 含量和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的 置信区间,就使用概率抽样。 非概率抽样:操作简单,时效快,成本低,而且对于抽样中的统计学专业技术要求不是 很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。它同 样使用市场调查中的概念测试(不需要调查结果投影到总体的情况)。 4 简述异众比率、四分位差、方差或标准差的适用场合 答:异众比率主要是衡量众数对一组数据的代表程度主要适合测度分类数据的离散程度; 四分位差主要适合于测度顺序数据的离散程度; 方差能够较好的反映出数据的离散程度,是实际中应用最广的离散 程度测量值,标准 差和方差基本上同时应用。 5 简述众数、中位数和平均数的特点和应用场合。 答:众数主要用于测度分类数据的集中趋势,也适用于作为顺序数据以及数值型数据集中 趋势的测度值。一般情况下,只有在数据量较大的情况下,众数才有意义。 中位数主要用于测量顺序数据的集中趋势,适用于测量数值型数据的集中趋势,但不适 用于分类数据。 平均数是集中趋势的最主要测度值,主要适用于数值型数据,而不适用于分类数据和 顺序数据。 6 根据自己的经验体会举几个服从正态分布的随机变量的实例。 答:如某种仪器每月出现故障的次数、一本书一页中的印刷错误、某一医院在某一天内的 急诊病人数、某班某次的考试成绩、某地区成年男性的身高、某公司年销售量、同一车间产 品的质量等。 7 请解释中心极限定理并结合自身经验列举中心极限定理的应用场景 答:中心极限定理是中讨论序列部分和分布渐近于的一类定理。这组定理是学和误差分析 的理论基础,指出了大量累积逐点收敛到正态分布的分布函数的条件。它是论中最重要的一 类,有广泛的实际应用背景。 中心极限定理:设从为 μ、方差为 σ^2; (有限)的任意 一个总体中抽取样本量为 n 的样本,当 n 充分大时,近似服从均值为 μ、方差为(σ^2 )/n 的正态分布。中心极限定理则表明变量在分布上的特征. 例如对一千居民收入随机调查,发现无论低收入还是高收入都是少数,而中等收入占多 数,即为正态分布. 计算题(要求使用 R 语言计算,列出计算过程中用到的 R 命令) 1 一种产品需要人工组装,现

您可能关注的文档

文档评论(0)

152****7770 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档