- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章 单变量描述性统计
第二章:单变量描述性统计 第一节 基本技术 一、定类层次 二、定序层次 三、定距层次 一、定类层次 适用于简化一个定类变量资料的方法有次数分布、比例、比率、图示和对比值。 1、次数分布,即频数 次数分布是变项内每一个值的原始资料出现多少次。 表1 两个假想社区中违法者和非违法者的频数 研究对象 社区1 社区2 违法者 初犯者 58 68 屡犯者 43 137 非违法者 481 1081 总 和 582 1286 2、比例 就是将每类的次数(f)除以总数(N),公式P=f/N 3、比率(百分比) 就是把计算比例时所用的基数变大为100,百分数的意思就是每一百有多少。 比率的公式为 百分率:f/N?100 千分率:f/N?1000 万分率:f/N?10000 关于比率(百分比)的例子 两条重要原则 在我们举的例子里,每个中心都有足够的个案使我们可以采用百分数,使用百分数和比例的前提是数目的稳定性,由此,我们可以得出两条重要原则: (1) 一定要在百分数或比例的旁边列出个案的数目。 (2) 只有在百分数基数(分母)的个案数目达到50左右,才使用百分数。如果个案数目很少,最好直接用每个类别的个案数目。 注意: 上表中的百分数是针对某些具体问题而忽略另一些的,它们显示出每一中心各自的情况,纵向百分比,纵向百分数是对那些影响两个样本容量的因数进行控制。 假定我们的兴趣主要在某一类型的个案以及各中心的该类型个案的相对数 目,则要计算横向百分比。 4、对比值 例:某地总人口中有28600名男性和23500名女性 则性别对比值:男性人数:女性人数=28600:23500=1217:1000 即每千名女性有1217名男性。 5、 图示法 就是以图形来简化资料 在社会学研究中,定类数量资料比较多用的有条形图和圆形图。 (1) 条形图 是以长方形的长度(宽度相同)来表示次数或百分率的多少,为求清楚长方形之间可以分开(当然也可以不分),宽度没有意义。 例:某地区人口构成:干部110人,工人152人,农民288人,总数550 下图是三者百分比的条形图 (2)圆形图:就是把一个圆形平面按数值的比例分割。 如: 农民360?52.4%=188.64? 工人360?27.6%=99.36? 干部360?20.0%=72? 二、定序层次 上面讲的基本技术,如次数、比例、比率、对比值、长条图和圆形图等,适用于简化定类资料,当然也可以用于简化定序资料,适用于定序层次而不可用于定类层次的,有累加次数和累加百分率。 1、累加次数 累加次数就是把次数逐级相加起来,分为两种;一种是向上累加(cf?),一种是向下累加(cf?),其作用是使我们容易知道某值以下(或以上)之次数总和。 向上累积表示由低层向高层累加,如上表五级 ? 一级;向下累积表示由高层向低层累加,如上表一级 ? 五级 累加百分率(%) 就是将各级的百分率数值逐渐相加。 三、定距层次 以上方法对定距层次的变量都适用,但定距层次的变量在使用这些方法时必须先进行分组,由具体数字转化为区间。 例:下列数字表示在某城市教育委员会选举中,93个普查区合格选民实际参加选举的百分比(%) 1、 间距的数目和大小 将这些数据分组时需要多少间距? 这些间距应该多大? 一般原则 A、作为间距的距离一般是整数如5、10、20,而不会选4、16;组限(即端点)一般用整数,如5、10。 B、首先采用大数目(间距的数目)的窄间距记分。 C、间距的宽度不应超过可忽略的数值之差。 用组距5 用组距10 比如20的间距 如果数据分组的主要目的在于简化计算,而不是要有意义地显示说明资料,就不应该使用开放间距。 2、间距的真正上限和下限 间距就是每组的范围,包括上限和下限。 真实下限=标示下限-0.05 真实上限=标示上限+0.05 组距=真实上限–真实下限 因此实际应用的真正界限如 下: -0.05~9.95 9.95~19.95 19.95~29.95 ………….. 按照惯例,必须指明量度的精确度 如10.45表示精确到小数点后二位,10.4表示精确到小数点后一位,如10.00~19.99真正界限是9.995~1
文档评论(0)