广中医针推统计学诊断.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学·以理解为主,没有名解 第一章 绪论(概念、区别变量类型和参数统计量) 1.抽样——从研究总体中抽取一部分有代表性的个体。 2.同质——同一总体的个体具有共性(大同小异)。 变异——同一总体中不同个体间存在的差异。 定量变量 离散型变量:只可取整数值(月份) 连续型变量:可取实数轴上任何数值(血压) 3.变量类型 (区别) 定性变量 分类变量(名义变量):如二分类变量(性别-男女)、多分类变量(职业) 有序变量(等级变量):如药物疗效-无效/一般/好转 变量的转化只能”高级”到”低级”:定量→有序→分类→二值 4.参数——描述总体分布数量特征的统计指标值(总体统计指标值)。其大小是客观存在的,但往往是未知的,需要通过样本资料来估计。 统计量——由观察资料(样本资料)计算出来的量(样本统计指标值)。是对总体参数的估计。 抽样误差——由抽样而造成的样本统计指标(统计量)与总体统计指标(参数)之差。 统计学关心的常常是总体参数的大小,其依据却是统计量及其性质。 研究设计 收集资料 5.统计工作的基本步骤 整理资料 定量资料统计描述—平均数 统计描述 定性资料统计描述—相对数 分析资料 参数估计 统计推断 (由样本信息对相应总体的特征进行推断) 假设检验 定量变量的统计描述 频率分布表(图)的用途: ①描述变量的分布类型:对称,非对称(偏锋) ②揭示变量的分布特征:集中趋势、离散趋势 [集中趋势与离散趋势同时存在,是随机变量分布的两个重要特征,通过描述变量的平均水平(集中趋势)和变异程度(离散趋势)可较全面地揭示数据分布的特征] (1)集中趋势的描述- 平均数——是分析定量资料的基本指标。用于描述一组同质观察值(变量值)的集中位置,反映一组观察值的平均水平或集中趋势。 应用\分类 算术平均数(均数) 几何均数 中位数 适用范围 适用于对称分布资料,尤其是正态分布或近似正态分布资料。 1.原始观察值分布不对称,但经对数转换后呈对称分布(正态分布)的变量。 2.当变量值之间呈倍数关系(等比数列)。 3.频率图呈正偏锋分布,均数变量平均水平的代表性较差 1.当一组变量值呈偏态(峰)分布; 2.资料的分布类型不清楚时; 3.数据大部分比较集中,少部分偏向一侧; 4.资料的一端或两端无界限 (2)离散趋势的描述-变异指标:极差、四分位数间距、标准差、变异系数。其中以标准差最常用。 特点:①四分位数间距常与中位数结合来描述变量的平均水平和变异程度。四分位数间距的适用范围即中位数适用范围。 ②标准差常与均数结合起来,从平均水平和变异程度两方面描述变量的分布特征。标准差适用范围即均数适用范围。 描述分布形态的统计指标:偏度系数、峰度系数 正态分布时,偏度系数与峰度系数均为0. 统计表的结构:表号及标题、标目、线条(三线表:顶线、底线、纵标目分割线)、数字。 定性变量的统计描述 定性资料常用相对数作为统计描述指标。常用的相对数有:频率、强度、相对比。 应用相对数的注意事项:1、防止概念混淆; 2、计算相对数时分母应有足够数量;3、正确计算合计率;4、样本相对数的统计推断;5. 注意资料的可比性;6、频率型指标的解释要紧扣总体与属性(总体不同、属性不同); 应用粗率标准化法的注意事项: ”标准”,算出的标准化率也会不同,比较的结果也未必相同。 ④两样本标准化率是样本值。存在抽样误差。比较两样本的标准化率,当样本含量较小时,还应作假设检验。 动态数列——按时间顺序将一系列统计指标(可以是绝对数,相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势。 常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。 动态数列的分析不仅可以总结过去,而且可以进行预测,即根据平均发展速度公式计算几年后达到的指标。 常用概率分布 二项分布 概念:观察结果是以两分类变量来表示的,如果每个观察对象阳性结果的发生概率均为π,阴性结果的发生概率均为(1-π);而且各个观察对象的结果是相互独立的,重复观察n次,发生阳性结果的次数X的概率分布为二项分布,记作B(n,π)。 特点:①结果只有两种可能;②事件的概率不变;③每次事件相互独立。 当n相当大(n≥100),只要π不太靠近0或1,特别是当nπ和n(1-π)都大于5时,二项分布近似正态分布。 正态分布 形状:一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线。 参数:位置参数μ——即总体均数,描述正态分布的集中位置。 变异度参数(形状参数)σ——为总体标准差,描述正态分布的离散程度。 z变换与标准正态分布 任意一个服从正态分布N(μ,σ2)的随机变量,均可以作标准化变换(也称z变换)。 变换后的z值仍服从正态分布,且

文档评论(0)

光光文挡 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档