《stata中变量描述分析和作图》.pptVIP

  • 6
  • 0
  • 约3.4千字
  • 约 54页
  • 2019-11-17 发布于天津
  • 举报
第三讲 描述性分析与画图;进行描述性统计分析的目的: 对数据进行描述性分析的目的是熟悉和了解数据的基本统计特征,把握数据的总体分布形态,进而决定如何对数据作进一步处理,进而回答所要研究的问题。;本章主要内容;数据描述的方法;描述性分析的菜单窗口;6.1.频数分布 频数、比例(proportion)、百分比(percentage)和比率(ratio)等描述性统计方法适用于所有类型数据,包括定性、定序、定距和定比数据。;频数与频数分布;菜单窗口;;单变量频数分布; girl in | 2004, 0=boy | ---1=girl | Freq. Percent Cum. ------------+----------------------------------- 0 | 1,248 53.70 53.70 1 | 1,076 46.30 100.00 ------------+----------------------------------- Total | 2,324 100.00 输出结果显示,该数据一共有2324个观察值 变量girl有两个取值:0代表男孩,1代表女孩 样本中有1248个男孩,占53.7%;女孩为1075,占46.3%;多变量频数分布;6.2.条件频数分布 条件频数分布也称交叉频数表为或列联表,同时生成两个变量之间关系的频数分布,属于相关分析中的一种.;基本命令;例1;6.3.频数分布的常见错误之一;6.3.频数分布的常见错误之二;6.4.变量的中央趋势和离散趋势;集中趋势:众数;集中趋势:算术均值(mean,average);集中趋势:中位数(median);离散趋势:极差或者全距(range,R);离散趋势:方差(variance);离散趋势:标准差(standard deviation);离散趋势:标准差(II);离散趋势:自由度;正态分布与偏态分布;正态分布(normal distribution);正态分布;偏态分布;6.5 描述性统计;标准信息描述;详细情况描述;变量age有2321个观察值 最小值为0,最大值为19 1%的样本为0岁 5%的样本1岁或以下 10%的样本2岁或以下 25%的样本5岁或以下 …… 99%的样本在19岁及以下 样本的均值为9.66;标准差为5.08;Variance、 Skewness和Kurtosis分别表示样本的方差为25.85、偏移度为-0.32和年龄分布的峰度为1.92。;6.5.描述数值型数据统计量的其它方法;均值估计(mean);比例估计(proportion);使用table命令描述数据;.table urban, contents(mean yrsch sd sibs) ------------------------------------ urban | residence | mean(yrsch) sd(sibs) ----------+------------------------- 0,Rural | 5.622172 .6296451 1,Urban | 7.109127 .5369387 ------------------------------------ 按urban的分类,计算变量yrsch的均值和sibs的标准差;使用tabstat命令描述数据 ;使用tabulate, sum命令描述数据 ;6.6 画图;Stata的制图功能;Stata制图的窗口菜单;Stata的其它制图功能;图形的种类及适用范围;散点图( Scatter Plot );散点图的基本命令;散点图的选项:总体外观;散点图的选项:绘图区域的大小;dsfdbsy384y982ythb3oibt4oy39y409705923y09y53b2lkboi2y58wy0ehtoibwoify98wy049ywh4b3oiut89u983yf9ivh98y98sv98hv98ys9f698y9v698yv98x98tb98fyd98gyd98h98ds98nt98d8genklgb4klebtlkb5k tkeirh893y89ey698vhkrne lkhgi8eyokbnkdhf98hodf hxvy78fd678t9fdu90gys98y9shihixyv78dfhvifndovhf9f8yv9onvkobkw kjfegiudsfdbsy384y982ythb3oibt4oy39y409705923y0

文档评论(0)

1亿VIP精品文档

相关文档