- 1、本文档共29页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
02数据整理讲述
数据整理与图表呈现 一、数据的整理 1、数据的整理 生物研究中收集的各种原始资料杂乱无章,只有经过整理分析才能从中提取出有用的信息。 在对资料进一步分析之前,需要进行认真的整理。 1.审核资料 审核资料的目的,是为了剔除不合格的资料,以确保资料的可靠性和可信性。 审核是对原始资料进行初步的审查和核实。不符合要求的数据主要有三种:缺失、可疑、失误。 缺失:指数据不全或缺项未填;例如一份资料中未回答的问题占10%以上,或者缺少关键性资料。 可疑:指难以辨认或怀疑其真实性的数据;例如,有的被试填答的问卷全部选同一个选项(如全选A或全选B);有的被试填答的结果可以看到是一种规则的排列方式(如A B C D E D B C A B C D E……)。 失误:指存在明确差错的数据或答案。 在剔除不合格问卷的过程中,注意不能把一些不符合自己主观假设的数据随意去掉。因此这项工作一定要非常慎重。对于个别极端数据是否该剔除,应遵循三个标准差法则。 2.数据的分组 分组要以被研究对象的本质特性为基础 分类标志要明确,要能包括所有的数据 数据分组的标志 性质类别:按事物的不同性质进行分类。 数量类别:按数值大小进行分类,并排序。 数据类型 变量、随机变量、观测值 变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 总体、个体和样本 需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本; 而n <30的样本称为小样本。 统计量和参数 二、统计表 统计表是用来表达研究变量与被说明的事物之间数量关系的表格。它可以将大量数据的分类结果清晰、概括、一目了然地表达出来,便于分析、比较和计算。 1、统计表的构成 例: 北京市四街道智力落后患者分布 2.统计表的种类 简单表:只按研究现象(或变量)的名称、地点、时序等列出数据的统计表。 分组表:只按一个标志分组的统计表称为分组表。 复合表:按两个或两个以上标志分组的统计表称为复合表。 简单表 各校学生数一览表 分组表 上海市区男幼儿20米跑步用时 复合表 某年级操行评定结果 例: 中学生心理烦恼调查被试分布 三、统计图 统计图是整理和呈现数据的另一种方法,它把研究变量与被说明事物之间的数量关系用图形表现,直观、形象地表达出事物的全貌及其数据的分布特征,使人一目了然,便于理解和记忆,印象深刻。 1、统计图的构成 统计图一般由图号、标题、标目、图形、图注等几部分构成。 统计图中的标目由基线和尺度线构成。对于有纵、横轴的统计图,一般以基线表示被观察的现象,而尺度线则表示其数量。 2、统计图的分类 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。 单式条形图 复式条形图 某年级操行评定结果条形图 三项影响较大的SARS信息对不同文化程度民众的影响 圆形图 某年级操行评定结果圆形图 绘制圆形图的步骤 求出各组成部分所占的百分比 求出各部分的中心角度 以顺时针方向画出扇形 标出不同颜色及百分比 线形图 线形图用来表示连续型资料。它能表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。 基于线形图,既可对有关统计变量进行数量比较,又可分析发展的趋势。 例如:对有意义的词汇,小学一年级至初中三年级学生视觉、听觉记忆再现率的情况。 * * 比率数据 等距数据 等级数据 分类数据 计数数据 离散型数据 测量数据 连续型数据 β b 回归系数 ρ r 相关系数 σ S 标准差 μ 平均数 参数 统计量 统计指标 数字 横标目 纵标目 横标目的总标目 表2-1 统计表的格式 顶线 底线 表线 表号 标题 标目 标目 表注 注: 3.1 159 51841 甲 3.5 263 76030 乙 3.4 782 229168 总计 3.3 170 51788 丁 3.8 190 49508 丙 患病率(‰) 病人数 检查人数 街道 1051 893 762 985 人数 D校 C校 B校 A校 学校 6.04 5岁~ 5.53 6岁~ 7.16 7.71 平均用时
文档评论(0)