- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
 - 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
 - 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
 - 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
 - 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
 - 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
 - 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
 
                        查看更多
                        
                    
                统计学(statistics):统计学是关于数据(data)的科学,是从数据中提取信息的一门学科,包括设计、搜集、整理、分析和表达等步骤。
医学统计学(medical statistics):用统计学的原理和方法研究医学中的问题。
卫生统计学(health statistics):与医学统计学基本相同,但更侧重于社会、人群的卫生问题。
变异(variation):社会和生物医学中的普遍现象。变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。
变量(variable):可以测量的任何特征或属性(不同个体结果可能不同)
随机变量(random variable):在概率论中称变量为随机变量 
对随机变量的取值过程为测量。取值所采用的标准为测量尺度。
总体(population):根据研究目的确定的同质研究对象的全体(集合)。分有限总体与无限总体
样本(sample):从总体中随机抽取的部分作为直接观察测量的研究对象   
随机抽样:为了保证样本的可靠性和代表性,需要采用随机的方法抽取样本(在总体中每个个体具有相同的机会被抽到)。
参数(parameter):总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数 
统计量(statistic):通过对样本观察测量所获得的数据进行统计分析所产生的统计指标,如样本均数、标准差,采用拉丁字母分别记为    ,参数附近波动的随机变量 。
样本的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f 次,则事件A出现的频率为f/n。
概率(probability):随机事件发生的可能性大小,用大写的P 表示;取值[0,1]。    
P ≤ 0.05(5%)或P ≤ 0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。
误差(error):测量值(实际值)与真值(理论值)之差
随机误差(随机抽样误差):研究对象本身的变异性引起的。影响因素众多,变化无方向性,不可避免,但可用统计方法进行分析。
偏差(bias):非随机因素所造成的测定值和真值之间的差别。系统误差和非系统误差的总和
系统误差:受确定因素影响,大小变化有方向性。
非系统误差(过失误差):研究者偶然失误而造成的误差。
准确度(accuracy)或真实性(validity) :观察值与真值的接近程度,受系统误差的影响(常用指标:如灵敏度、特异度)。
可靠度(reliabiliy)—— 也称精密度(precision)或重复性(repeatability) :重复观察时观察值与其均值的接近程度,受随机误差的影响(常用指标:一致百分率、Kappa值)。
统计描述:即计算统计指标,如平均值、发病率等,绘制统计图。
计量资料(measurement data):指对每个观察单位用定量方法测定某项指标所得的数值。基本特征:①有定量手段或工具;②一般有度量衡单位;③往往带有小数点。
计数资料(enumeration (counting) data):指先将观察单位按性质或类别进行分组,然后清点各组观察单位的个数所得资料。基本特征为:①无顺序分组;②清点每组个数。
等级资料(ranked data):指先按某种属性的不同程度分组,再清点各组观察单位个数所得资料。特征:①有顺序分组;②清点各组个数。
极差(range):即最大值与最小值之差,又称为全距。
右偏态分布(正偏态分布):右侧的组段数多于左侧的组段数,频数向右侧拖尾。 
左偏态分布(负偏态分布):左侧的组段数多于右侧的组段数,频数向左侧拖尾。 
频数(frequency):对一个变量进行重复观察,其中在某取值下出现的次数。
相对频数(relative frequency):频数在总的观察例数中所占的比例
累积频数(cumulative frequency):将频数累积
相对累积频数(relative cumulative frequency):累积频数在总例数中的比例
组距(class interval):相邻两组段下限值之差
平均数(average):一类用于描述数值变量资料集中趋势的指标。
算术均数(arithmetic mean):简称均数(mean),是一组一致性质相同的数值之和除以数值个数所得的商,可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。适用于对称分布,特别是正态分布资料。
几何均数(geometric mean):将n个观察值X的乘积再开n次方所得的根。可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。适用于成等比数列的资料,特别是服从对数正态分布资料。
中位数(median):是将每个变量值从小到大排列,位置居于中间的那个变量值。       
                
原创力文档
                        

文档评论(0)