信息组织学 第9章 信息组织技术.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息组织学 第9章 信息组织技术

第九章 信息组织技术 组织技术包含的种类很多,本章主要介绍一般性的信息组织技术,如代码和编码技术、分词和标引技术、数据库技术、数据仓库技术,以及适合于数字资源组织的超文本技术和用于构建数字空间的虚拟现实技术。 9.1 代码与编码技术 9.1.1 代码 1.代码的概念 代码是符号的一种,它与语言文字、图形、数字符号一样,可以用来代表或描述特定的信息,它不是通常的符号,而是指那些为便于信息组织、传播、存贮检索和加工处理而设计的非常规的符号。 9.1.1 代码 ? 2.代码的功能 (1)代码能够简明、精确地描述信息。 (2)代码可以反映信息的类别特征 (3)代码有利于信息组织 (4)代码可以服务于特殊的信息处理需求。 9.1.1 代码(续) ? 3.代码的类型 (1)按代码构成成分不同,代码可分为单纯代码和混合代码。 (2)按照代码组织功能不同,可以将其划分成排序码和无序码。 (3)按代码组合的方式不同,可分成层次码、特征组合码和镶嵌式组合码。 9.1.1 代码(续) 3.代码的类型-镶嵌式组合码 ISBN(国际标准书号) International Standard Book Number 由十位数字组成。被三条短横线分为四段,组号—出版者号—书序号—校验号 第一个号码段是地区号,又叫组号 (Group Identifier),大体上兼顾文种、国别和地区。把全世界自愿申请参加国际标准书号体系的国家和地区,划分成若干地区,各有固定的编码. 9.1.1 代码(续) 3.代码的类型-镶嵌式组合码 地区号: 0、1代表英语,使用的国家有:澳大利亚、加拿大、爱尔兰、新西兰、波多黎各、南非、英国、美国、津巴布韦等; 2代表法语,法国、卢森堡以及比利时、加拿大和瑞士的法语区使用该代码; 3代表德语,德国、奥地利和瑞士德语区使用该代码; 4是日本出版物的代码; 5是俄罗斯出版物的代码; 7是中国出版物使用的代码。 9.1.1 代码(续) 3.代码的类型-镶嵌式组合码 第二段号码是出版社代码(Publisher Identifier),由其隶属的国家或地区ISBN中心分配,允许取值范围为2~5位数字。出版社的规模越大,出书越多,其号码就越短。 第三个段是书序号(Title Identifier)由出版社自己给出,而且每个出版社的书序号是定长的。最短的一位,最长的六位。出版社的规模越大,出书越多,序号越长。 9.1.1 代码(续) 3.代码的类型-镶嵌式组合码 第十位是电子计算机的校验码(Check Digit)。固定一位,起止号为0~10,10由X代替;11,用“0”表示 检验位是用来检验前9位代码是否正确,计算方法是,用10,9,8,7,6,5,4,3,2分别乘以ISBN的前9位数字,所得乘积相加之和除以11,用11减去所得余数即为校验码。 如《国际经济学》一书的ISBN号为: ISBN 7—300—02904—3/F892 9.1.2 信息编码(续) ?(4) 按代码的主要用途,可以区分为信息识别组织代码和信息传输/交换代码。 《BIG5》是台湾计算机界实行的繁体汉字编码字符集。它包含了 420 个图形符号和 13070 个汉字(不包含简化汉字) 9.1.2 信息编码(续) ?(4) 按代码的主要用途,可以区分为信息识别组织代码和信息传输/交换代码 GB (国标编码)是中华人民共和国信息交换汉字编码标准(GB2312-80), 在此标准中制定了每一个汉字及非汉字符号的编码。规定将汉字字符分为87个区, 每个区有94个汉字(94位),因此共制定了87x94=8178个汉字、字符。 每一个字符的编码由2个字节(Byte, 一个字节有8位--Bit, 可以有256种不同表示)构 成(分别称为高字节和低字节),其值分别为其区位码值各加上32(既16进制的20H),如中国的“中”字位于54区48位,其国标码就是5650H。 9.1.2 信息编码(续) ?(4) 按代码的主要用途,可以区分为信息识别组织代码和信息传输/交换代码。 当想在由西方人发明的计算机中使用汉字时,由于国标码的范围与计算机中使用的 ASCII 码(American Standard Code for Information

文档评论(0)

ctuorn0371 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档