数据描述方法的.pptVIP

  1. 1、本文档共86页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据描述方法的

综合评价;课本: 统计学 ─从数据到结论;参考书目:;课程大纲 1 统计学基本概念、数据收集和数据描述 2 线性回归分析和广义线性模型SPSS上机 3 聚类分析 + SPSS上机 4 判别分析 + SPSS上机 5 主成份+ 因子分析、 6 对应分析+SPSS上机;统计学的定义;什么地方统计用得上呢?;运用统计的领域包括(1);统计可应用于各个不同学科,在有些学科已经有其特有的方法和特点;如生物统计(biostatistics), 计量经济学(econometrics)以及目前很热门的生物信息(bioinformation)和数据挖掘(Data Mining)的方法主体都是统计。 以归纳为主要思维方式的统计不是以演绎为主的数学; 第二章: 数据的收集 ;二手数据(Secondary data ) - 从报纸、书刊、电视看到的数据。 -从网站上找到的数据 - 由公司或组织专门收集和维护数据 - 由政府机构收集和维护 比如高速公路通车里程、物价指数、股票行情、外汇牌价、犯罪率、房价、流行病的有关数据(确诊病例、疑似病例、死亡人数和出院人数等等) ; 原始数据(一手数据,Primary data - 要去收集 - 用科学的方法 书:抽样调查(sampling techniques) -例子:预测美国总统大选结果 某个决策的民意调查 中国人口普查;原始数据收集方法 ;实验数据 例:冶炼金属 - 该金属的强度高为目标 - 金属强度与温度和时间长短有关 - 寻找最佳温度和时间 ;2. 电话调查要点(邮件问卷情况相同) 定义关心的调查问题 定义所关心的总体 专家开发调查问题 小规模试用 pre-test 决定样本量和抽样方法 sample size 抽取样本并进行调查;电话调查 -要解释调查目的 purpose of the survey - 要调查的人是否能通过电话找到 - 时间要短 - 固定结果问题 Closed-end questions - 告诉被访者结果保密 - 花费相对不太高、有效率 ; 3. 邮件问卷 花费低 问卷可含固定结果和不固定结果问题 (both closed-end and open -end questions) 使参加者有更多时间完成问卷 提供更准确可靠的数据 ;固定结果的问题 Closed-end questions – 如: “请问你所属的党派 - 是共和党、民主党还是其他党派? 不固定结果问题 Open-end questions – 如: “你所属的党派? ;4. 直接观测和面对面采访 直接观测:是否系安全带、 新影电影是否成功 面对面访采访 personal interview 固定问题Structured interview (scripted) 不固定问题unstructured interview ;数据收集注意事项 1. 查找一下是否有二手数据存在 2. 在利用二手数据之前,要核实数据来源,确认收集和录入的数据符合你的研究目的 3. 要注意一下偏差(bias) . 如:不回答是否随机,否则数据会有系统偏差, 抽样偏差, 有些人可能会在回答某些敏感问题时撒谎;如何用一部分数据较好地 代表所有数据 与抽样有关的概念: 总体、样本、个体和样本量 普查和抽样框 参数和统计量;确定观测对象和范围(总体): 按户口所在地,还是居住地,还是出生地? 抽出多少人? 如何抽? 随机? 两省各自随机抽取5000人男女各半(样本). 利用这10000个数据回答所关心的问题 (T-test, T检验) ; 此例中,单个山东和广东人或个人的身高数据称为个体(individual) 而称所有所有山东和广东人或他们的身高数据为总体(population),总体是包含所有要研究的个体的集合。 抽样抽到的人或身高数据称为该总体的样本(sample),样本是总体的一部分。样本中个体的个数--样本量(sample size); 当然,也有可能试图调查所有的人(比如人口普查), 叫做普查(census). 抽样框(Frame)–所关心的所有对象或个- 是总体的一部分 ; 参数和统计量 参数(parameter)- 从整个总体达到的平均值或百分比等描述性数据. 而从样本中得到的相应的数据称为统计量Statistics. ;一些常用的抽样方法 ;1 简单随机样本;2.系统抽样(systematic sampling): 先把总体中

文档评论(0)

ayangjiayu1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档