统计数据集xml格式使用-2016年中期人口统计.pdfVIP

统计数据集xml格式使用-2016年中期人口统计.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计数据集xml格式使用-2016年中期人口统计

统计数据集(XML 格式)使用指南 A. 下载及解压统计数据集 1. 从2016 年中期人口统计的网站下载统计数据集(ZIP 格式) 。 2. 把统计数据集解压到你的计算机内的一个文件夹,其中包括: i. 1 个XSD 档案[Census_IDDS_(yyyyMMddhhmmss.xsd)]; ii. 1 个XML 档案[Census_IDDS_(yyyyMMddhhmmss.xml)]; B. XML 架构(XSD) 以下是XML 架构的规格和关系: 1. XSD元素(即数据表) Class_code Class_var Observation Special_note_comby Special_note SV Stat_var Table_Information Class_code_parent_n 2. 下图显示不同数据表之间的关系: 3. 数据模型 以下摘要提供数据模型中的关键概念: 3.1 在数据模型中,统计数据是由“统计变量(SV) ”及“统计展示(SP) ”所表 示,例如,“人口”是统计变量,而“总数”、“去年同期增长百分比” 及“总数(不包括外籍家庭佣工) ”是统计变量“人口”的 3 种不同统计展 示。 3.2 每个统计数值( 即统计变数及展示(SVSP) 的数值) ,是由一个或多个“分类 变量(CV )”所定义,以给出该数值的统计意义。例如,对于 SVSP “人 口总数”,“7 071 576”的数值是由“年份是2011”所定义(或“分类”); 而“3 303 015”的数值则由“年份是2011”和“性别是男性”所定义。统计 数值的更详细级别,可通过包含更多的分类变量而定义。 3.3 一个分类变量可以有不同的分类编码数值(Class code values),例如,“男性” 和“女性”是分类变数“性别”的两个分类编码数值。一个分类变量所包含 的分类编码数值不一定彼此互不兼容。 例如,分类变量“时间”,可能的 分类编码数值为“2001”、“2002” 、...、“2015”; “2015 年 1 月”、“2015 年2 月”... ; “2015 年上半年”、“2015 年下半年”,对于分类变量“年龄”, 可能的分类编码数值为“0” 、“1”、“2” 、... 、“84” 、“85+”; “0-4” 、 “5-9”、...、“80-84”、“85+”; 对于分类变量“家庭成员人数”(用于分类 SVSP“家庭住户总数”),可能的分类编码数值为“1”、“2 ”、...、“5 ”、 “6+ ”。 3.4 属于相同分类变量的分类编码数值的子集可以共同组成一个“制表格式 (TF )”,以用于构建多维统计表。例如,按年份(CCYY 格式)、五岁 年龄组别(即“0-4” 、“5-9”、...、“80-84”、“85+” )和性别(“男”、“女”) 分析的人口总数是一个有可能存在的三维统计表。 3.5 对于单一个分类变量,可以定义多个制表格式以乎合不同的制表需求。 例 如,SVSP “人口总数”可以按“单岁年龄组别”和“性别”进行分析; 但 如果进一步纳入“教育程度”作为第三个分类变量,SVSP “人口总数”仅 适用于“五岁年龄组别(即“0-4” 、“5-9” 、...、“80-84”、“85+” )”、 “性别”和“教育程度”。因此,分类变量“年龄”需要两个制表格式作 定义。 3.6 某些属于相同分类变量的制表格式可以在其分类编码数值之间展现主次关 系。 例如,对于分类变量“年龄”, 五岁年龄组别(即“0-4” 、“5- 9” 、...、“80-84”、“85+” )是单岁年龄组别(即“0” 、“1”、“2” 、...、 “84”、“85+” ) 的主制表格式; 对于分类变量“地区”而言,“香港、九 龙、新界”是「区议会区分区」(包括中西区,湾仔,东区等…

文档评论(0)

ailuojue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档