- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
描述性统计学
描述性统计学 作者 Dr. Maria Correa-Prisant (北北卡罗来纳州立大学兽医学院微生物学、病理学和寄生虫学系) 翻译 lvruiqin(DXY) 描述性统计学 变量的类型 概括性统计学 分布 图形描述 变量的类型 连续型:温度、心率等 高斯分布(Gaussian distribution),钟罩形 离散变量、分类变量 定序型数据(Ordinal):腹痛的程度、肿瘤大小 定类型数据(Nominal):品种、性别 二项数据(Binominal):是或否、出席或缺席 正态和偏态分布 变量或分布的类型决定了所使用的统计方法 集中趋势和离散 集中趋势的测度 均值(Mean)、中位数(Median)、众数(Mode) 离散程度的测度 标准差(Standard deviation)、百分位数(percentiles) 集中趋势的测度:均值(Mean) 均值、中位数、众数 呼吸频率 甲组=(11,12,13,14,15) ;均值=13 乙组=(11,12,13,13,14,25);均值=15 均值为极端值所影响 中位数是13: 分割数据成50:50的值(数据按升序或降序排列) 众数是13:出现最多的数 集中趋势的测度 离散程度的测度 标准差(Standard deviation) 1sd,2sd,3sd 百分位数(Percentiles) 25,50,75,90,95 极差(Range) 最大值-最小值 标准差 百分位数 白细胞计数 均值的置信区间(Confidence Interval for the Mean) 分类数据 肿瘤大小 小,中,大 甲组:1,1,2,2,2,2,2,3 1, 2, 3 乙组:1,2,2,3,3,3,3,3 均值=NO! 同时, 中位数=YES! 频数 众数=YES! 比例 直方图 交叉列联表和图表说明 联系 联系并不意味着因果关系 因果关系是联系的一种特殊形式 标准包括力度、短暂性、生物梯度、一致性等 联系的检验——定义假设 零假设——想要拒绝的 备择假设 * 对所得数据有一个总体“感觉” 评价数据的质量 对称 均值、众数、中位数 单峰 偏向左侧 众数、中位数 单峰 尾部(tail) 双峰 使用非参数检验 使用连续型变量的检验 连续型 定序型 定义新的变量或者进行转变 均值(Mean):对于连续型数据而言 此处,X1,X2,…,Xn是独立的值并且N是测量的总数。 方差 70%下侧 30%上侧 第70个百分位数值 四分之一分位数=25% 四分之二分位数=50% 茎叶图(Stem Leaf) 大猩猩属(Gorilla gorilla ) N:29个大猩猩 平均白细胞数:10.3 SD 5.02 中位数:8.3 大猩猩属 佛罗里达海牛(Florida Manatee) 淋巴细胞 单核细胞 总蛋白质 重量 置信区间 更多样本 组别 甲 乙 肿瘤大小 频数表 比例:肿瘤大小为1,甲组中占2/3 每个细胞观察到的数目 这篇讲稿中我们将讲述基本的统计概念。 作者 Dr. Maria Correa-Prisant (北北卡罗来纳州立大学兽医学院微生物学、病理学和寄生虫学系) 翻译 lvruiqin(DXY) 与临床工作相比较,这是一条了解就诊者“数据集”的途径。 有许多不同类型的变量。辨别它们的类型很重要,因为这决定了我们用何种统计分析方法。 这些是连续型数据不同分布的图形描述 不能对定序或定类型变量使用连续型变量适用的检验。 正态分布数据的均值、中位数、众数重叠。 只对于连续型变量。 数据非正态分布时,均值不宜作为集中趋势的测度。 数据的离散程度可以用标准差或百分位数表达。当数据非正态分布时用标准差不恰当。 2倍的标准差经常用到 将数据简单地分为100份,百分位数不是由数据的分布决定的。 数据显示和摘要 * * * 这篇讲稿中我们将讲述基本的统计概念。 作者 Dr. Maria Correa-Prisant (北北卡罗来纳州立大学兽医学院微生物学、病理学和寄生虫学系) 翻译 lvruiqin(DXY) 与临床工作相比较,这是一条了解就诊者“数据集”的途径。 有许多不同类型的变量。辨别它们的类型很重要,因为这决定了我们用何种统计分析方法。 这些是连续型
您可能关注的文档
- 技术参数标准.doc
- 技术参数要求.doc
- 技术和经济评估小组的组织和成员变化澳大利亚、巴西、中国.doc
- 技术型高级中等学校课程纲要.ppt
- 技术市场统计报表制度.doc
- 技术单位的人事考绩表格.doc
- 技术性贸易措施最新通报-广西出入境检验检疫局.doc
- 技术性贸易措施最新通报.doc
- 技术合同登记表.doc
- 技术方案选择三、实践结果四、今后打算.ppt
- 2023年度安全员考试题库检测试题打印附答案详解(达标题).docx
- 2023年度安全员考试题库检测试题打印(实用)附答案详解.docx
- 2023年度安全员考试题库检测试题打印附完整答案详解【名师系列】.docx
- 2023年度安全员考试题库检测试题打印及答案详解【考点梳理】.docx
- 2023年度安全员考试题库检测试题打印附完整答案详解【各地真题】.docx
- 2023年度安全员考试题库检测试题打印附参考答案详解【完整版】.docx
- 2023年度安全员考试高分题库含答案详解(精练).docx
- 2023年度安全员考试高分题库及参考答案详解【能力提升】.docx
- 2023年度安全员考试高分题库附答案详解【典型题】.docx
- 2023年度安全员考试高分题库及参考答案详解(培优B卷).docx
文档评论(0)