- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2003年9月 北京大学光华管理学院 胡健颖 市场调研 Marketing Research 主讲人:蔡清毅 厦门理工学院文化传播系 2007年5月 市场调研 描述性统计 ——频数分布:列联表和假设检验 1.数据的表现—统计数字和统计图表 假如你已经获得了所要的全部数据; 认识数据的第一步:你得到的是什么类型的数据? 利用图和表来展示数据中的信息; 运用指标刻画数据的某些特征和程度; 使用EXCEL来完成对数据的描述。 数据变量的分类 按照取值类型:品质数据和数量数据; 按照测量水平:定类(Nominal)、定序(Ordinal)、定距(Interval)、定比(Ratio)等四类; 按照获取时间:截面数据、时间序列; 不同类型的数据应使用不同的统计方法; 问题:刚才的数据表中分别是什么类型? 区分不同的测量水平 区分原则:定类数据没有大小之分;定序数据有大小之分,差值有意义;定距数据有大小之分,差值有意义,但其比值无意义;定比数据比值有意义。 定比定距数据可以向前化成定序或者定类数据,但是将损失一定信息;反之,不能将定序定类数据化成定距定比数据。 品质标志的描述方法(1) 频数分布、相对分布、百分比频数分布 品质标志描述方法(2) ————条形图、柱形图 某校学生对体育锻炼态度调查结果 品质标志的描述方法(3) ————饼图 某校学生对体育锻炼态度调查结果 对矿泉水市场的调查 北京市居民矿泉水最喜欢品牌 数量标志的描述方法(1) 频数分布 单项式分布 组距式分布:等组距、不等组距 有关概念:组数、 组限(上限、下限)、 开口组、闭口组、组距、 组中值 数量标志的描述方法(2) 数量标志的描述方法(3)————直方图 数量标志的描述方法(4) 对数据进行探索性分析:J.W.Tukey; 茎叶图(Stem-leaf) 描述两个变量的关系 研究两个变量之间的关系:两个变量的类型分别是什么? 两个品质变量之间的关系; 一个品质变量和一个数量变量的关系; 两个数量变量之间的关系。 交叉分组列表(列联表) 表1 学生性别对体育锻炼的态度调查结果比较 图形展示两个变量的关系 描述两个数量型的变量 ————散点图 数据描述的数值方法 通过数据指标来概括数据中的信息; 如何刻画数据的集中程度,或集中位置; 如何刻画数据的变异程度; 如何刻画检验异常值; 如何刻画两个变量之间的关系; 探索性分析。 数据集中位置的度量 平均数(Mean) 中位数(Median) 众数(Mode) 四分位数(Quartiles) 百分位数(Percentiles) 调整(或截尾)平均数(Trimmed Mean) 一个例子 某城市一居室月租金(美元)的70个数据 平均月租金 月租金的中位数 中位数=(475+475)/2=475美元 月租金的众数 众数是450,450出现的最多,频数是7 理解百分数 P百分数是这样一个数,它使得至多有p%的数据项小于这个数,而且至多有(100-p)%的数据的数据大于这个数。 中位数和上下四分位数都是特殊的百分位数。 计算第P百分位数的步骤 以递增顺序排列原始数据(由小到大); 计算 I=(p/100) n; 如果I不是整数,将I向上取整。大于I的毗邻整数指示第p百分位数的位置;如果I是整数,则第p百分位数是第I项与第I+1项的平均值。 月租金的第90百分位数 计算I=(90/100) 70=63。所以第90百分位数是 第63和64个数的平均值。 四分位数 第一个四分位数 =第25百分位数 第三个四分位数 =第75百分位数 截尾均值 去除 %的最大和最小值,计算剩余数的平均值。 月租金的5%的截尾值=487.19 考虑数据的类型 不同类型的数据应该采用不同类型的指标来刻画他们的集中位置。 对于定类数据你能够做什么? 对于定序数据你能够做什么? 对于定距数据和定比数据你能够做什么? 数据变异程度的度量 全距(Range) 四分位间距(IQR) 方差(Variance) 标准差(Standard Deviation) 变异系数(Coefficient of Variance, CV) 月租金的全距和四分位间距 关于方差和标准差 总体方差 样本方差 总体标准差σ,样本标准差s。 样本的标准差系数= 月租金的标准差 方差 标准差 标准差系数 探索性的数据分析 五数概括 最
您可能关注的文档
最近下载
- 养老护理员(初级实操)汇总.docx VIP
- 《电力需求响应系统通用技术规范 》.docx VIP
- 保健按摩师(高级)技能理论考试题库(含答案).pdf VIP
- 中职课件:心里健康与职业生涯全册课件).pptx VIP
- 塑料添加剂研究报告.ppt VIP
- Part 1-2 Unit 1 Personal and Family Life 课件-中职高一英语(高教版基础模块1).pptx
- (高清版)DGJ 08-81-2021 现有建筑抗震鉴定与加固标准.docx VIP
- 2025年营养餐感恩教育主题班.pptx VIP
- 如何提高道德与法治课堂提问的有效性.docx VIP
- 土地复垦施工方案.doc VIP
文档评论(0)