- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
非數值數據的表示
由於電腦內部只能識別和處理二進位代碼,所以字元和漢字都必須按照一定的規則用一組二進位編碼來表示。
字元的表示字元編碼方式有很多種,現在用的最廣泛的是美國國家資訊交換標準字元碼(ASCII)。標準的ASCII碼用7位二進位表示一個字元,它包括10個十進位數字(0~9)、52個英文大寫和小寫字母(A~Z,a~z)、34個專用符號和32個控制符號,共計128個字元。在128個字元中有96個是可列印字元。
字元的表示在電腦中,通常用一個位元組來存放一個字元。對於ASCII碼來說,一個位元組右邊的7位表示不同的字元代碼,而最左邊一位可以作奇偶校驗位,用來檢查錯誤,也可以用於西文字元和漢字的區分標識。
字元的表示ASCII字元編碼表
字元的表示在ASCII字元編碼表中,數字和英文字母都是按順序排列的,只要知道其中一個的二進位代碼,不要查表就可以推導出其他數字或字母的二進位代碼。
字元的表示數字0~9的高3位編碼為011,低4位為0000~1001。如果去掉高3位或將高3位清零,只保留低4位,則正好是二進位形式的0~9。這樣既滿足了正常的排序關係,又有利於實現ASCII編碼與二進位數之間的轉換。
字元的表示英文字母的編碼值也滿足正常的字母排序關係,並且大、小寫字母的編碼之間有簡單的對應關係,差別僅在b5這一位上,若為0,則是大寫字母,若為1,則是小寫字母。
漢字的表示漢字的字數繁多,字形複雜,讀音多變,常用的漢字就有7000個左右。要在電腦中表示漢字,最方便的方法是為漢字安排一個編碼,而且要使這些編碼與西文字元和其他字元有明顯的區別。
漢字的表示漢字國標碼亦可稱為漢字交換碼,主要用於漢字資訊處理系統之間或者通信系統之間交換資訊使用。1981年國家標準總局公佈了GB2312-80,即《資訊交換用漢字編碼字元集基本集》,簡稱GB碼。該標準共收集常用漢字6763個,其中一級漢字3755個,按拼音排序。二級漢字3008個,按部首排序。另外還有各種圖形符號682個,共計7445個。
漢字的表示GB2312-80規定每個漢字、圖形符號都用兩個位元組表示,每個位元組只使用低7位編碼,因此最多能表示出128×128=16384個漢字。
漢字的表示區位碼將漢字編碼GB2312-80中的6763個漢字分為94個區,每個區中包含94個漢字(位),區和位組成一個二維數組,每個漢字在數組中對應一個為唯一的區位碼。漢字的區位碼定長4位,前兩位表示區號,後兩位表示位號,區號和位號用十進位數表示,區號從01到94,位號也從01到94。例如,“中”字在54區的48位上,其區位碼為“54–48”,“國”字在25區的90位上,其區位碼為“25–90”。
漢字的表示區位碼表的佈局是這樣安排的,第1~15區包含西文字母、數字和圖形符號,以及用戶自行定義的專用符號;第16~55區為一級漢字;第56~87區為二級漢字;87區以上為空白區,可供造新字用。
漢字的表示區位碼表的佈局
漢字的表示漢字區位碼和漢字國標碼兩者之間的關係:漢字國標碼=漢字區位碼(十六進制)+2020H例如:已知漢字“春”的區位碼為“20-26”,計算它的國標碼。第一位元組 第二位元組區位碼: 20 26 十進位 ↓ ↓ 14H 1AH 十六進制+20H +20H國標碼: 34H3AH
漢字的表示漢字可以通過不同的輸入碼輸入,但在電腦內部其內碼是唯一的。因為漢字處理系統要保證中西文的相容,當系統中同時存在ASCII碼和漢字國標碼時,將會產生二義性。例如:有兩個位元組的內容為30H和21H,它既可表示漢字“啊”的國標碼,又可表示西文“0”和“!”的ASCII碼。為此,漢字機內碼應對國標碼加以適當處理和變換。
漢字的表示漢字機內碼也是兩位元組長的代碼,它是在相應國標碼的每個位元組最高位上加“1”,即:漢字機內碼=漢字國標碼+8080H例如,上述“啊”字的國標碼是3021H,其機內碼則是B0A1H。
漢字的表示漢字字形碼是指確定一個漢字字形點陣的代碼,又叫漢字字模碼或漢字輸出碼。在一個漢字點陣中,凡筆劃所到之處,記為“1”,否則記
文档评论(0)