- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
同质(homogeneous)示例 变异(Variation)示例 变异(Variation)示例 总体和样本 总体(Population):根据研究目的所确定的同质观察单位的全体; 样本(Sample):是从总体中按照一定的目的按照一定的原则抽取的一部分个体。 请考虑如何判断样本是否有代表性;抽样研究的目的? 随机、样本含量;推断总体信息 变量与变量值 在医学研究中,根据研究目的的要求对一些观察项目或研究指标在一些研究对象中进行观察(或测量),由于这些指标存在着变异,故把这些观察项目或研究指标(属性、特征)称为随机变量,简称变量(variable),而观察结果对应的取值称为变量值或资料(value of variable) 。 参数和统计量 总体参数 (Parameter ):描述总体特征的指标。 统计量( Statistic):反映样本特征的指标。 总体参数与统计量有哪些区别与联系呢? 答:1.在总体被确定之后,总体参数就是一个常数,是 不会变化的,不管你是否确切知其大小;而统计量是几乎总是随着样本而变的。 2.为了区分参数与统计量通常用希腊字母表示参数;用拉丁文字母表示统计量。 3.通常参数是未知的,而统计量则可以通过抽样研究得到,故统计学通常用统计量估计参数(参数估计)。 抽样误差 【定义】由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为抽样误差(sampling error)。 各种参数都有抽样误差,这里我们以均数为研究对象 假如事先知道某地七岁男童的平均身高为119.41cm。为了估计七岁男童的平均身高(总体均数),研究者从所有符合要求的七岁男童中每次抽取100人,共计抽取了三次。 三次抽样得到了不同的结果,原因何在? 抽样误差的表现 概率 概率的统计学定义: 数理统计学中的大数定理表明:当观察次数n越来越大,频率f的随机波动幅度越来越小,并最终趋向于一个常数p:随机事件A发生的概率 (Probability)。 概率描述了随机事件发生的可能性的大小。是一种参数。 0≤P ≤1 小概率事件 小概率事件 医学研究中,将概率小于等于0.05或0.01的事件称为小概率事件。 小概率原理 小概率事件并不表示不可能发生,但在某一次试验中,由于其发生的可能性十分小,近似认为是不会发生的。 由于个体变异的存在,医学研究得到的原始数据(raw data)往往是庞大的,但也不是杂乱无章的,而是有一定规律的,呈一定的分布(distribution) 频数分布表的基本思想:将原始数据按照一定的标准划分为若干各组,合计各组数据的个数(频数),得到频数分布表;在将频数表绘制成频数分布图。通过它们探寻数据的分布规律。 离散型定量变量的频数分布 离散型定量变量(discrete variable)通常是指取值不连续的定量变量,通常只能取数轴上的整数值。 例如受检次数、新生儿数、手术病人数等 例:1998年某山区96名孕妇产前检测次数数据? 表1 1998年某山区96名孕妇产前检测次数频数分布表 频数分布图(直条图bar chart) 连续型定量变量的频数分布 连续型定量变量(continuous variable)通常是指取值连续的定量变量,可以取数轴上的任意数值。 例如身高、体重、血压、血清胆固醇值等 例:某地120名18-35岁健康男性居民血清铁含量(mmol/L)数据 连续型定量变量频数分布表 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。对于100余例的数据通常分为8-15组。或根据以下经验公式: 确定组距:组距是一个组的下限与下一个组段下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=Int [( 最大值 - 最小值)÷ 组数 ] 列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值{半开半闭,尾数关闭} 统计出各组的频数并整理成频数分布表 表2 120名正常成年男子血清铁含量(mmol/L)频数表 频数分布表、图所提供的信息 频数分布图用以表示数据的分布规律; 观察分布范围及有无可疑值 ; 考察分布的类型 ; 对称分布 非对称分布(偏态分布) 左偏态(负偏态) 右偏态(正偏态) 集中趋势(central tendency) 1. 同质的群体中数据向其中心值靠拢的倾向和程度 2. 测量集中趋势就是寻找数据水平的代表值或中心值,该值通常称为:平均数 3. 不同类型的数据用不同的集中趋势测量值 4. 常见的平均数指标有:算术均数、几何均数、中位数、众数
文档评论(0)