统计学报告(人口密度地域差异分析).docVIP

  • 85
  • 0
  • 约4.56千字
  • 约 8页
  • 2017-04-26 发布于重庆
  • 举报
统计学报告(人口密度地域差异分析)

统 计 学 2010年中国各地域人口密度差异分析报告 单因素方差分析 张X 报告时间:2012/12/24 试用单因素方差分析方法分析中国地域是否对人口密度有影响 摘要:中国是一个人口大国,总人数在13亿以上,但其人口分部及其不均衡,东西南北地域的人口密度差距相当巨大。 单因素方差分析法作为统计学中的一种统计方法,其运用简单,不仅可以提高检验效率,同时由于它是将所有样本的信息结合在一起,也增加了分析的可靠性。 关键字:地域 人口密度 统计学 单因素 方差分析 方差分析(analysis of variance,ANOVA)就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。当方差分析中涉及一个分类型自变量时称为单因素方差分析(one-way analysis of variance). 单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。 现在用单因素方差分析的方法分析中国地域是否对人口密度有影响。 数据来源:(2010年人口普查结果) 为了方便,中国按大区划分华北、东北、华东、华中、华南、西南、西北等几个部分,一般这样划分: 1、华东地区 6省市 (包括山东、江苏、安徽、浙江、福建、上海);? 2、华南地区 3省 (包括广东、广西、海南);? 3、华中地区 4省 (包括湖北、湖南、河南、江西);? 4、华北地区 5省市 (包括北京、天津、河北、山西、内蒙古);? 5、西北地区 5省区 (包括宁夏、新疆、青海、陕西、甘肃);? 6、西南地区 5省区市 (包括四川、云南、贵州、西藏、重庆);? 7、东北地区 3省 (包括辽宁、吉林、黑龙江);? 8、台港澳地区。 以下人口密度数据按上述各地域省份的顺序排放: 表1(单位:人/每平方千米) 观测值因素(i)(j)华东地区华南地区华中地区华北地区西北地区西南地区东北地区港澳台地区1622.841775579.4618444307.89532011167.40285794.8998494167.0506855299.83771766396.0144932766.6657212195.028089310.12144481144.97557513119.9223559146.543740714753.728813425.9163207255.0446471563.0153713382.8140657.790006922197.423113684640.46014774533.5969706 266.8711078228.4843954181.55339492.444760586  5304.1567683  2056350.500243  63653.833016        根据上表数据,开始单因素方差分析: 分析步骤 1.提出假设 与通常的 HYPERLINK /wiki/%E7%BB%9F%E8%AE%A1%E6%8E%A8%E6%96%AD \o 统计推断 统计推断问题一样,方差分析的任务也是先根据实际情况提出原假设H0与备择假设H1,然后寻找适当的检验统计量进行 HYPERLINK /wiki/%E5%81%87%E8%AE%BE%E6%A3%80%E9%AA%8C \o 假设检验 假设检验。  表1中的数据可以看成来自8个不同总体(每个水平对应一个总体)的样本值,将各个总体的均值依次记为μ1,μ2,μ3,μ4,μ5,μ6,μ7,μ8,则按题意需检验假设   Η0:μ1=μ2=μ3=μ4=μ5=μ6=μ7=μ8,地域对人口密度无显著影响;   Η1:μ1,μ2,μ3,μ4,μ5,μ6,μ7,μ8不全相等 ,地域对人口密度有显著影响。 2. 构造检验的统计量 (1)计算各样本的均值 假如从第个总体中抽取一个容量为的简单随机样本,令为第个总体样本的样本均值,则有 其中: 式中,为第个总体的样本量的第个观测值。例如根据上表1中的数据,分别计算8个样本的均值为: 样本1的均值1051.168429 同理可得343.1781935,361.975811,588.9122714,70167.4682317,176.8737256,7263.401151。 (2)计算全部观测值的总均值。 它是全部观测值的总和除以观测值的总个数,令总均值为,则公式为 根据上表1中的数据我们可得出八个样本的总均值为 =

文档评论(0)

1亿VIP精品文档

相关文档