[农林牧渔]统计在考古学中的应用-第六讲.pptVIP

[农林牧渔]统计在考古学中的应用-第六讲.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[农林牧渔]统计在考古学中的应用-第六讲

统计学在考古中的应用 第六讲 两个总体平均值差的估计 来自两个总体的独立样本对其总体均值的检验 大样本 计算统计量的标准差 两个样本的个体间是否独立 钱币贬值 Emp1 384 4.85 0.32 Emp2 377 4.79 0.24 成对样本的问题 减肥数据(diet.txt)。这里有50对数据。为50人是减肥前后的重量 要比较50个人在减肥前后的重量。 不能用前面的独立样本均值差的检验;这是因为两个样本并不独立。每一个人减肥后的重量都和自己减肥前的重量有关。但不同人之间却是独立的。 令所有个体减肥前后重量差(减肥前重量减去减肥后重量)的均值为mD;这样所要进行的检验为 成对样本的问题 我们可以把两个样本中配对的观测值逐个相减,形成一个由独立观测值组成的样本;然后用单样本检验方法,看其均值是否为零。 在相减之后公式和单样本均值检验无异。当然,如果直接选用软件中成对样本均值的检验,就不用事先逐个相减了。这里也有单尾和双尾检验。 成对样本的问题 再接着看例6.4。计算机输出了双尾p-值0.002,这里的单尾p-值于是为0.001。因此在显著性水平为0.001时,可以拒绝零假设。也就是说,减肥后和减肥前相比,平均重量显著要轻。下面是这个检验的SPSS的部分计算机输出为(删去了置信区间): 非参数检验 关于非参数的一些常识 经典统计的多数检验都假定了总体的背景分布。 但在总体未知时,如果假定的总体和真实总体不符,那么就不适宜用通常的检验 这时如果利用传统的假定分布已知的检验,就会产生错误甚至灾难。 关于非参数的一些常识 无需假定总体分布的具体形式,仅仅依赖于数据观测值的相对大小(秩)或零假设下等可能的概率等,和数据本身的具体总体分布无关的性质进行的检验都称为非参数检验(nonparametric testing)。 这些非参数检验在总体分布未知时有很大的优越性。它总是比传统检验安全。 在总体分布形式已知时,非参数检验不如传统方法效率高。这是因为非参数方法利用的信息要少些。往往在传统方法可以拒绝零假设的情况,非参数检验无法拒绝。 但非参数统计在总体未知时效率要比传统方法要高,有时要高很多。是否用非参数统计方法,要根据对总体分布的了解程度来确定。? 秩(rank) 非参数检验中秩是最常使用的概念。什么是一个数据的秩呢?一般来说,秩就是该数据按照升幂排列之后,每个观测值的位置。例如我们有下面数据 秩(rank) 利用秩的大小进行推断就避免了不知道背景分布的困难。这也是非参数检验的优点。 多数非参数检验明显地或隐含地利用了秩的性质;但也有一些非参数方法没有涉及秩的性质。 优势 稳健性 robust 测量尺度无约束、数据要求不严格,适用多种数据类型 小样本、无分布样本、受污染样本、混杂样本 单样本检验 单样本中位数(a-分位数)符号检验 我们知道某点为中位数(a-分位数)意味着一个数小于该点的概率应该为0.5(a). 因此,一个观测值小于该点(或与该点之差的符号为负号)的概率为0.5(a)。 这就是符号检验名称的来源,并与二项分布有关。 例:数据gs.txt 例16.1 质量监督部门对商店里面出售的某厂家的西洋参片进行了抽查。对于25包写明为净重100g的西洋参片的称重结果为(单位:克): 数据gs.txt 样本中位数为m=98.36。因此,人们怀疑厂家包装的西洋参片份量不足。由于对于这些重量的总体分布不清楚,决定对其进行符号检验。需要检验的是: 数据gs.txt 按照零假设,每个观测值(每包西洋参的净重)大于中位数m0=100g的机会和小于100g的概率都是0.5。这服从二项分布Bin(25,0.5)。 重于100g的只有8包。这样的二项分布变量小于或等于8的概率为0.05388。这就是p-值。 因此, 对于水平a=0.05, 根据这个符号检验,没有充分的证据拒绝零假设。 数据gs.txt 数据gs.txt SPSS软件使用 这里有两种选项方式: 1.以数据gs.sav为例。直接使用SPSS选项Analyze-Nonparametric Tests-Binomial,再把变量gsweight选入Test Variable List,然后在下面Define Dichotomy的Cut point输入100(克),在下面Test Proportion输入p0=0.50(零假设大于100g的比例);还可以点击Exact来选择精确检验,渐近检验和Monte Carlo方法等,然后OK即可得到前面显示的结果。 SPSS软件使用 2. 数据gs.sav有一列(变量名为m),这是重复零假设的100g使得m的长度和gsweight一样。然后利用选项Anal

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档