第三节 SARP专业字典、词典.doc

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 专业字典、词典 本章讨论的是SARP系统的专业字典(单位字典、分组标志全集字典以及指标词典)。这部分内容是用户在处理一特定专业时,该专业各表所共同使用的“公共信息”部分,也是SARP系统的基础部分,占有较重要的位置。 §3.1 单位字典表 §3.1.1 单位字典表的概念 在进行统计报表处理时,首先接触到的是填报报表的基层单位和进行报表处理的汇总单位。在一定时期,对于一个特定的统计专业的各统计表通常是由相同的单位填报,也就是说:一个统计专业,虽然有众多的表式、指标各异的报表,但处理单位是相同的。基于这一特点,我们将一个统计专业各报表统一使用的处理单位全体独立建库,作为独立于各表而又为各表共同使用的公共信息库。由于该库记录的是单位信息,所以我们将其称之为单位字典库。 单位信息包括:单位代码、单位名称、分组标志值、单位注释以及一些内部使用的附加信息。 一个统计专业,只能有一个相应的单位字典库。鉴于此,对那些虽属同一统计专业,但处理单位集不同的报表,可将其划分为不同专业来进行处理,以保证各专业下的各表使用的是相同的字典库。 §3.1.2 单位编码 每一个参加处理的单位都应有唯一的单位编码,这个编码是系统识别该单位的关键字,只有通过它,系统才能区分、查找单位。   单位编码通常采用层次码与顺序码两种编排形式。 从广义上讲,顺序码实际上是层次码中较特殊的一种,我们下面只讨论层次码。层次码采用将编码划分为若干小段的方法编排。每一小段代表一定含义,使各单位隶属关系更为明显,归类更为方便。 将编码按小段进行划分,每段代表一定的含义,其段总数称为编码的层数。在单位编码上我们习惯称之为单位编码的级数。 下面我们通过两个例子来解释单位编码的概念。   1、国家行政区划码 行政区划码是全国省、地、县、乡四级的编码(目前,年报只用到乡级)。采用九位编码方式,第一段为省级编码;第二段为地级编码;第三段为县级编码;第四段为乡级编码。共为四个小段,分别表示省、地、县、乡。   所以,国家行政区划码: 编 码 级 --- 4级 1级编码长度 ---2位 2级编码长度 ---2位 3级编码长度 ---2位 4级编码长度 ---3位 一 级 单 位 ---所有省级单位 二 级 单 位 ---所有地级单位 三 级 单 位 ---所有县级单位 四 级 单 位 ---所有乡级单位   从编码上能直接看出它代表的是哪一级单位及其隶属关系。   2、对某地轻工业与重工业系统的各企业编码   满足上述要求的编码方法较多,在这里我们采用的是二层的方法,即第一层为1位,代表所属系统;第二层为3位,代表企业的顺序号。 可编为: 1000 轻工业系统 1001 企业1 1002 企业2 . . . . . . 2000 重工业系统 2001 企业1 2002 企业2 . . . . . .  该编码方法: 编 码 级 ----2级 1级编码长度 ----1位 2级编码长度 ----3位 一 级 单 位 ----两个,“1000”与“2000” 二 级 单 位 ----所有企业 通过上述两个例子,可以看到描述一种编码的方法主要是通过“编码级”与“各级编码长度”两个指标来完成。这两个概念非常重要,必须弄清楚。 在一定的编码规则下,编码长度不足或超长都属非法编码的范畴。另外,还有一类非法编码不易为用户所发觉,这就是“越级编码”,即其编码在隶属关系上出现间断。   例:在国标行政区划码的编码规则下,下述编码均为越级编码: 530001、002321、530022 编码“530001”

文档评论(0)

kehan123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档