- 24
- 0
- 约3.7千字
- 约 26页
- 2020-08-09 发布于湖北
- 举报
第五章 数据分析 第1节 数据处理——调查资料的编码 编码的类型 编码:将获取的资料转换成数字的过程,即调查信息的数据化。如“1”表示“男性”,“2”表示“女性”。 编码的目的:便于计算机的处理。 编码的类型:前编码和后编码 前编码:调查之前确定编码(封闭式问题) 后编码:调查之后确定编码(开放式问题) 编码举例 (1)您个人的基本情况 A性别:1男 2女 1 B年龄: 周岁 0 4 5 C职业: (请注明) 1 2 8 (2)贵公司总部所处地理位置: 1东城 2西城 3宣武 4崇文 5 5海淀 6朝阳 7丰台 8石景山 9通州 10顺义 11平谷 12大兴 13门头沟 14昌平 15延庆 16密云 17怀柔 18房山 (3)贵公司曾经做过哪些广告?(不限项) 1电视广告 1 2广播广告 0 3报纸广告 3 4杂志广告 0 5户外广告 5 6网络广告 6 7其他( ) 0 “无回答”的编码 如果被调查者没有回答某一问题,一般使用一个具体数字表示,如“9”、“99”等。 如:国标编码,性别 0,1,9 第2节 统计分析 1对资料进行简化和描述 2对变量之间的关系进行描述和深入分析 3通过样本资料推断整体 按定类、定序、定距、定比尺度 描述统计 单变量描述统计 描述某个变量属性值的集中趋势、离散趋势及其分布 集中趋势分析(众数mode、中位数median、平均数mean) 1众数 观测数据中出现频率最高的属性值。定类尺度下适用 表9-1 集中趋势分析数据 2中位数 将变量数据一分为二的变量值。 样本为奇数:Md=(n+1)/2 样本为偶数:Md=(n+1)/2左右两数的平均值 中位数适合描述定序尺度的数据集中趋势 有时也能描述定比和定距的集中趋势 3平均数 观测值的总和除以观测次数x =Σxi/N 。 定距和定比尺度下应用最多,特点是稳定,精确,多次抽样平均趋于接近 96,96,97,99,100,101,102,04,155 则,众数=96,中位数=100,平均数=105.6 22000,23000,23000,25000, 26000,28000,55000 众数=23000 中位数=25000 平均数=28857 离散趋势分析 描述数据的差异程度。 例: A: 39 39 39 40 41 41 41 B: 10 20 30 40 50 60 70 中位数相同,平均数相同,但差异很大(离散趋势) 1极差(range) 组中最高值与最低值的差距。 2四分互差用于度量定序数据变异指标 将一组数列等分为四段,各段分界点上的数称为四分位数。第一个四分位数q1以下包括25%的数据,第二个四分位数q2以下包括50%的数据,第三个四分位数q3以下包括75%的数据。四分互差就是第三个四分位数与第一个四分位数的差的一半。 q=( q3-q3 )/2 3标准差(定比和定距数据变异指标) 反映离中指标 σ:标准差 xi :样本值 x :平均数 N :样本数 频数和频率分布 频数分布:描述变量观测值中各
您可能关注的文档
最近下载
- 2025年衢州国企水处理岗位考试模拟试卷及答案.docx VIP
- 基于微信小程序的实验室管理系统的设计与实现.docx VIP
- 2024届高考英语二轮专题复习读后续写 :巧妙结尾之情景交融 借物抒情 课件 (共14张PPT).pptx VIP
- 谐振变换器的性能分析与 GaN 器件应用-高圣伟-天津工业大学.pdf VIP
- 2020-2023年广西公务员考试《申论》真题(B卷)及参考答案.doc VIP
- EMI 滤波器共模电感设计的关键影响因素分析-林苏斌-福州大学.pdf VIP
- 西门子SINAMICS DCM参考手册2011(中文).pdf VIP
- 客舱乘务员手册.pdf
- 河北省单招考试十类真题及答案.doc
- 《种子检验技术》全套教学课件(共11章).pptx
原创力文档

文档评论(0)