科学研究中收集数据的方法.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
科学研究中收集数据的方法 陕西师范大学 刘新平 一、引言 科学研究离不开两种分析 1.理论分析(定理、命题等) 2.实证分析 利用获取的资料、数据进行分析以对理论上获得的结论进行实际验证。 数据分为离散型数据和连续型数据。 离散型数据一般指取整数值的数量指标,这类数据是计数性的,数据之间不能再划分为更小的单位,如学校的个数,学生的人数等,有些指标是按属性来分的,例如学生能力,可分为优、良、中、差,但我们可以使其量化,用5代表优,4代表良,3代表中,2代表差,这样的数据仍然是离散型的。 连续型数据一般指经过度量和测定而得到的数量指标,这类数据可以连续变化,可以无限细分,取值可以充满一个区间。例如,学生的考试分数,儿童的体重,测量的误差,平均气温,降雨量,候车时间等,这类数据常以小数形式出现,也可以整数出现,但可以小数化,如90分记为90.0分。 科学研究中的数量化分析其主要工具是数学,而数据分析的工具主要是统计学。 数学的产生有点哲学味,不是一种静止的东西,而是人类创造力的活动,毕达哥拉斯把世界和数字联系起来(万物皆数)1是最神圣的数,天下一切源于1。中国古代一生二,二生三,三生万物。 统计与数字相关,应用广泛(源于十七世纪,日本,预测统计学与生活息息相关)。 如医学与统计学(统计解决相关性,不解决因果性,如:流行病原因是什么)上海有人利用数据结论是:心肌梗塞与持续高温有关(70年代)。又如鸡叫天亮,但天亮的原因不是鸡叫,移项产生了代数,丈量土地产生了几何,赌博产生了概率(1664年pemore,打赌问题)预测产生了统计,数学与日常生活相关,投资,炒股,领带打法30种,甚至足球点球大战。 英国有人用数据统计起动右脚向左扑(旧金山大学人力动力学高麦加里博士)分析1982—1998年,数据,英格兰点球大战惜败阿阿根廷原因。 给出一个数学模型 其中::为最可进球机率 :已往进球情况 :此前进球可能性 :相反顺序 :压力 表明罚点球时先让5人中成绩最差者上,1998年如让谢林汉姆上(第二轮)则英格兰可能胜。 结论:守门员扑球要点有4个因素,①罚者眼睛;②助跑速度;③站立姿势;④最重要的是用哪只脚罚。 又如教育投入产出(何时入学最好?)有人统计过,平均6.5岁。 综上:统计是一门艺术(不是音乐、美术、舞蹈)而是一门数据的艺术和科学。 统计分为:1. 描述性统计; 2.推断性统计 由部分→整体(样本→总体) (坐井观天) 可信性多大?(概率是基础) 为什么要抽样?(原因①②) 样本的代表性?推断的准确性?什么是概率?(美国:可能性),天气预报,降水概率(日本最先开始)。 二、获取数据的基本方法 1.统计调查(收集现象数字资料的过程) 按范围有全面调查(普查,报表),非全面调查(重点,典型,抽样)。 按方式有直接观察,采访(问卷),报告(上报)制定调查表,确定目的,对象,项目和指标。 2.抽样调查 抽样方式: 有放回抽样 从总体中抽出一个个体记下其特征后再放回总体,然后进行第二次抽样 无放回抽样 从总体中抽出一个个体后不再放回去,再抽第二次 当总体内个体数目较多时,这两种抽样方式没有本质区别。教育统计中一般采用无放回抽样,但由于有放回抽样能简化某些计算,故当总体内个体数目较多时,我们可以看做是有放回抽样。通过抽样获取数据离不开求实的科学态度和认真的工作作风,数据如果不准确、不完整、或有遗漏,不仅数据本身失去价值,而且以此进行分析推断还会导致错误的结论。 ①简单随机抽样 (1)随机数表法 随机数表是根据数理统计的原理,由许多随机数字排列起来的数字表,表中数字的构造方法是:利用计算机使0,1,…,9十个数字号码中每次自动出现一个号码,用这种方式得到一串数,编排成组(一般四个数为一组) (2)抽签法 抽签法是将所有个体编号打乱次序用类似于抽签的方法从中来获取随机样本 ②分层抽样 分层抽样是按一定标志把总体内的每个个体划分为若干层,使相互差异小的个体集中在一层内,从而可以缩小各层内个体之间的差异程度,使样本中各个个体在总体中散布更均匀。 分层抽样时,从各层抽取的样本个数可以与各层个体数成比例。 具体做法是:把总体中N个个体划分为L个不相重叠的部分,使每一部分包含的个体数分别为N1,……,NL,且N=N1+N2+…+NL 则第h层所含的样本个体数为 , 其中n为样本容量,为第h层的层权数。 例如,要从某校210名7至9岁儿童中抽出三分之一进行智力测验。已知该校7岁儿童有63人,8岁儿童有112人,9岁儿童有35人,现在用分层抽样法确定各年龄组儿童入数。由(1.1.1)式得 (7岁组)=(210/3)×(63/210)=21(人), (8岁组)=(210

文档评论(0)

dashewan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档