- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
外语教学与研究统计方法.ppt
外语教学与研究统计方法 为什么要学习统计方法? 1. 统计方法给我们一种看问题的视角、分析问题的手段,使我们可以从数量的角度,分析和认识现象的特点、规律、模式、趋势或关系。 2. 统计方法给我们一种精确测量的手段。例如对于“水平高”的概念,我们可以用数学计量的手段给予更精确的描述。 3. 可以使我们对现象的数量表现,做出更科学的判断。 4. 增强研究的自主性。数据收集的过程是自主的,对数据的处理和分析是原创的,得出的结论大大避免了抄袭的危险。 第一讲 基本概念1. 数据类型:定类数据与定距数据2. 总体与样本3. 误差:抽样误差与非抽样误差4. 显著性与显著水平 1. 不同的数据需要采用不同的统计方法; 2. 人们一般研究的都是样本; 3. 统计中误差无所不在; 4. 显著性反映的是研究结论的确定性。 数据类型之:定类数据 定类数据是一种分类数据。它是对观测对象按不同特性分类,并统计各类出现的次数(频数)后得到的结果。 例如可以按性别、班级、课程等进行分类统计。定类测量中的类没有大小之分,只有频数高低。不能在类之间进行数学运算。 数据类型之:定距数据 定距数据是对测量对象按一定尺度测量后得出的数值。所用测量尺度有恒定的单位,单位之间的距离是相等的。 例如对成绩、年龄等的测量通常得到的是定距数据。人们可以对定距数据进行数学运算,比较不同数值之间的大小。 总体总体指具有相同特征或者性质的所有个体之和。总体可大可小。例如二语学习者是大总体,某校一年级新生则是小总体。 样本 样本指从总体中选取的一部分个体。由于常常不能直接研究总体,所以人们常常通过样本来推断总体。 样本有随机样本和非随机样本之分。 抽样误差抽样误差是客观存在。只要从总体中抽取样本,就会存在抽样误差。 从一个总体中抽取的样本均值与总体均值之间多数存在差异。 从一个总体中抽取的不同样本均值之间也多数存在差异。 为了减少抽样误差,最好用随机抽取的大样本。 非抽样误差非抽样误差是由于技术上原因,如测量工具不准,或是人为操作造成的误差。 比较典型的非抽样误差是考试分数合计错误,或者是数据录入失误。 避免非抽样误差的方法是仔细测量和认真录入与核对。 显著性显著性的概念涉及统计分析结果的可靠性。显著性检验用于验证统计结果是自然存在的还是由偶然因素如误差造成的。 显著性水平 显著性水平是衡量显著性的标准。在社会科学和应用语言学研究中,通常设定的显著水平为p=0.05。 大于0.05的统计结果,通常说无显著差异,或无显著相关。 等于/小于0.05的统计结果,通常说有显著差异,或显著相关。 描述统计 平均值、标准差、交互表、频数表 平均值:所有个值之和除以个值的数目。总体均值用μ表示,样本均值用表示。 70个学生的四级平均成绩 标准差:是数据内部差异的一种量度。标准差越大,内部差异也越大。例:两个班期末考试平均分相等,甲班的标准差为5分,乙班的标准差为10分,说明乙班的内部差异大于甲班。 70个学生四级成绩的标准差 Empirical Rule1 经验法则1 正态分布的数据 -1σ μ +1σ 大约68%的数值在均值的一个标准差范围内 Empirical Rule2 正态分布的数据 -2σ μ +2σ 大约95%的数值在均值的2个标准差范围内。 Empirical Rule3 正态分布的数据 -3σ μ +3σ 几乎全部(99.7%)数值在3个标准差范围内。 大学英语四级考试成绩分布 均值:500 标准差:70 430 500 570 大约68%的四级考试分数在430到570之间。 大学英语四级考试成绩分布2 360 500 640 大约95%的考试分数在360到640之间。 英语四级考试成绩分布 290 500 710 几乎全部(99.7%)数值在290到710之间。 交互表交互表是对定类数据的一种归纳和表现形式。交互表根据行数和列数,分别有2x2表, 2x3表,或者j x k表。 频数表一种频数表是简单罗列数据中每个数值出现的次数;另一种频数表是按一定的区间,分组统计和罗
您可能关注的文档
- 危急重症的药物应用..ppt
- 危重患者营养支持与管理.ppt
- 卷积码的维特比译码及卷积码性能分析.ppt
- 压力缓解与情绪管理作业.ppt
- 原子核集体激发的费米液体模型研究.ppt
- 原料药的有机合成和纯化.ppt
- 原材料认识及分析.ppt
- 双腔导管血流不足的原因及处理.ppt
- 反射率和直流电学特性分析.ppt
- 发生各种护理紧急状态时的.ppt
- FAIR 数据共享指导原则详解 _ 【官网】探码科技.pdf
- 非结构化数据管理与 AI Ready 数据准备白皮书预览版 _ Baklib.pdf
- 广东省惠阳市马安中学2023-2024学年中考数学五模试卷含解析.doc
- 广东省广州四中学2023-2024学年中考三模数学试题含解析.doc
- 广东省东莞市虎门汇英校2024年中考联考数学试题含解析.doc
- 广东省佛山市顺德区市级名校2023-2024学年中考数学适应性模拟试题含解析.doc
- 广东省高州市九校联考2024年毕业升学考试模拟卷数学卷含解析.doc
- 广东省东莞市五校2024届中考数学仿真试卷含解析.doc
- 广东省惠州光正实验2023-2024学年中考数学适应性模拟试题含解析.doc
- 广东省东莞市中学堂星晨校2024届中考联考数学试卷含解析.doc
文档评论(0)