- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 专业字典、词典
本章讨论的是SARP系统的专业字典(单位字典、分组标志全集字典以及指标词典)。这部分内容是用户在处理一特定专业时,该专业各表所共同使用的“公共信息”部分,也是SARP系统的基础部分,占有较重要的位置。
§3.1 单位字典表
§3.1.1 单位字典表的概念
在进行统计报表处理时,首先接触到的是填报报表的基层单位和进行报表处理的汇总单位。在一定时期,对于一个特定的统计专业的各统计表通常是由相同的单位填报,也就是说:一个统计专业,虽然有众多的表式、指标各异的报表,但处理单位是相同的。基于这一特点,我们将一个统计专业各报表统一使用的处理单位全体独立建库,作为独立于各表而又为各表共同使用的公共信息库。由于该库记录的是单位信息,所以我们将其称之为单位字典库。
单位信息包括:单位代码、单位名称、分组标志值、单位注释以及一些内部使用的附加信息。
一个统计专业,只能有一个相应的单位字典库。鉴于此,对那些虽属同一统计专业,但处理单位集不同的报表,可将其划分为不同专业来进行处理,以保证各专业下的各表使用的是相同的字典库。
§3.1.2 单位编码
每一个参加处理的单位都应有唯一的单位编码,这个编码是系统识别该单位的关键字,只有通过它,系统才能区分、查找单位。
单位编码通常采用层次码与顺序码两种编排形式。
从广义上讲,顺序码实际上是层次码中较特殊的一种,我们下面只讨论层次码。层次码采用将编码划分为若干小段的方法编排。每一小段代表一定含义,使各单位隶属关系更为明显,归类更为方便。
将编码按小段进行划分,每段代表一定的含义,其段总数称为编码的层数。在单位编码上我们习惯称之为单位编码的级数。
下面我们通过两个例子来解释单位编码的概念。
1、国家行政区划码
行政区划码是全国省、地、县、乡四级的编码(目前,年报只用到乡级)。采用九位编码方式,第一段为省级编码;第二段为地级编码;第三段为县级编码;第四段为乡级编码。共为四个小段,分别表示省、地、县、乡。
所以,国家行政区划码:
编 码 级 --- 4级
1级编码长度 ---2位
2级编码长度 ---2位
3级编码长度 ---2位
4级编码长度 ---3位
一 级 单 位 ---所有省级单位
二 级 单 位 ---所有地级单位
三 级 单 位 ---所有县级单位
四 级 单 位 ---所有乡级单位
从编码上能直接看出它代表的是哪一级单位及其隶属关系。
2、对某地轻工业与重工业系统的各企业编码
满足上述要求的编码方法较多,在这里我们采用的是二层的方法,即第一层为1位,代表所属系统;第二层为3位,代表企业的顺序号。
可编为:
1000 轻工业系统
1001 企业1
1002 企业2
. .
. .
. .
2000 重工业系统
2001 企业1
2002 企业2
. .
. .
. .
该编码方法:
编 码 级 ----2级
1级编码长度 ----1位
2级编码长度 ----3位
一 级 单 位 ----两个,“1000”与“2000”
二 级 单 位 ----所有企业
通过上述两个例子,可以看到描述一种编码的方法主要是通过“编码级”与“各级编码长度”两个指标来完成。这两个概念非常重要,必须弄清楚。
在一定的编码规则下,编码长度不足或超长都属非法编码的范畴。另外,还有一类非法编码不易为用户所发觉,这就是“越级编码”,即其编码在隶属关系上出现间断。
例:在国标行政区划码的编码规则下,下述编码均为越级编码:
530001、002321、530022
编码“530001”
文档评论(0)