- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
随机抽样 random sampling 为了保证样本的可靠性和代表性,需要采用随机的方法抽取样本(在总体中每个个体具有相同的机会被抽到)。 抽样(Sampling):从研究总体抽取部分个体 样本(Sample):抽取的部分个体 数据(data):观察所得资料 推断(inference):分析样本数据 ,获得关于总体的知识 统计推断的工具 :有关概率论的理论 推断的结论从来不是完全肯定或是完全否定的。 关键与核心:抽样方法、样本的代表性和推断的方法 2.2 变量的类型 变量(variable)个体特征的数量描述 (1)定性变量 (i)分类变量或名义变量 可能的“取值”称为:分类变量的水平。 代码:用1、2、3、4、5等来表示各个水平。 二分类变量,也称为0-1变量或假变量。 (ii)有序变量: 种种可能的“取值”中自然地存在着次序。 (2)定量变量 (i) 离散型变量:取值为离散数值。例如 一个月中手术的病人数、一年里的新生儿数 。 (ii)连续型变量:可以取某区间实数变量。 由测量得到的一些变量如:身高、血压、体重等。 不同类型变量间关系 将一种类型的变量转化为另一种类型 变量只能由高级向低级转化: 连续型→有序→分类→二值 只有认识了数据的特点,才能正确地选用统计分析方法 定量数据 定性数据 (1)业务或报表等常规统计资料 优点: 容易得到,有一定的权威性 缺点:常常不适合特定研究目的、危险因素记录不全、统计的口径不一致、往往是“合计”资料 2.3设计与分析 在合计资料中观察到的关系,在个体水平上往往不存在 混杂因素:对混杂因素视而不见,孤零零的考察两个变量之间的关系常常得出荒谬的结论 (2)统计设计:医药卫生科研设计不可或缺的部分 干预性研究 物理、化学、生物方面的干预性实验 医学临床干预实验 精心设计:控制混杂因素措施 观察性研究:不可人为的控制许多混杂变量的数值 精心设计:抽样方法,样本量大小… 统计设计和统计分析是不可分割的两项内容,在学习和应用统计时需要将两者结合起来。 2.4:小概率事件与小概率原理 小概率事件 医学研究中,将概率小于等于0.05或0.01的事件称为小概率事件。 小概率原理 小概率事件并不表示不可能发生,但在某一次试验中该事件发生的可能性很小,可视为很可能不发生。 现代统计学的基本内容 一、试验设计 二、数据管理 三、统计分析 实验设计 临床试验设计 调查研究设计 数据管理 质量控制 统计描述 统计推断 * * * * * * 变量和数据 一个学校的注册在校男女生比例是固定的,为常量 但是,该校任意一群学生的男女生比例就不一定和全校的比例一样了,它为变量(variable)。 变量和数据 当变量按照随机规律所取的值是数量时该变量称为定量变量 (quantitative variable); 因为是随机的,也称为随机变量(random variable)。 如身高体重,购买某商品的人数等等 变量和数据 象性别,观点之类的取非数量值的变量就称为定性变量或属性变量或分类变量(qualitative variable,或categorical variable)。 这些定性变量也可以由定量变量来描述,如男女生的数目,持有某观点的人数比例等等。 变量和数据 定性变量只有用数量来描述时,才有可能建立数学模型,并使用计算机来分析。 数据中它们通常用哑元(dummy variable)代表,比如性别用0、1代表,三种收入用0、1、2代表(或用字母代表) 变量和数据 有了变量,何谓数据? 广州不同医院的手术分娩的孕产妇比例都不一样,这是变量 不同医院孕产妇数目以及分娩方式就是数据(data) 数据是关于变量的观测值。 变量和数据 通过数据可验证有关的理论或假定。 比如通过抽样调查验证美国选民对共和党候选人的支持率是否超过50% 通过抽样,可以检验某批产品是否合格等等 1.3变量之间的关系 现实世界紧密联系的 人们想知道投资方式和经济效益之间的关系、旅客人数和经济发展之间的关系等等 不讨论变量之间的关系,就无从谈起任何有深度的应用,统计的基本概念就仅仅是摆设而已。 定量变量间的关系 例1.1.广告投入和销售之间的关系。下表显示了某企业的广告投入和销售额之间的关系(万元)。 横坐标代表广告投入,而纵坐标代表销售收入。 看得出有何种关系吗? 定量变量间
文档评论(0)