一、引述
1、因原
我們知道,我國第一個(gè)關(guān)于漢字編碼字符集,是1980年發(fā)布的國家標(biāo)準(zhǔn)GB/T 2312-1980《信息交換用漢字編碼字符集 基本集》規(guī)范的,該漢字編碼字符集是稱為基本集的。之所以稱為基本集,是因?yàn)樵摑h字編碼字符集只是對我國最常用的、使用頻度比較高的6763個(gè)漢字進(jìn)行了二進(jìn)制編碼,這遠(yuǎn)遠(yuǎn)無法滿足我國對于漢字信息處理和交換的需要。當(dāng)初國家標(biāo)準(zhǔn)編制的思路是,根據(jù)實(shí)際需要,再發(fā)布漢字編碼字符集的相關(guān)輔助集的標(biāo)準(zhǔn),用以擴(kuò)充更多的編碼漢字,或作為不同使用場景(如繁體字、地名用字、古籍及古漢語研究用字等)的漢字。基本集重點(diǎn)是規(guī)范了漢字編碼的編碼體系和編碼方法;輔助集依此體系與方法擴(kuò)充更多需要的漢字,來構(gòu)成我國整體漢字編碼字符集。
欲具體了解GB/T 2312-1980(基本集)介紹的請進(jìn)入。
2、我國標(biāo)準(zhǔn)發(fā)布的輔助集
為此,為了擴(kuò)充更多編碼漢字,我國又相繼發(fā)布了漢字編碼字符集輔助集的標(biāo)準(zhǔn),目前共發(fā)布有7個(gè),它們是:第一輔助集(GB/T 12345-90)、第二輔助集(GB/T 7589-1987)、第三輔助集(GB/T 13131-1991)、第四輔助集(GB/T 7590-1987)、第五輔助集(GB/T 13132-1991)、第七輔助集(GB/T 16500-1998)和第八輔助集(SJ/T 11239-2001),但無第六輔助集。這些輔助集的標(biāo)準(zhǔn)大多為國家標(biāo)準(zhǔn),僅有一個(gè)為電子行業(yè)標(biāo)準(zhǔn)。下表1-2給出了這些標(biāo)準(zhǔn)的基本情況,包括標(biāo)準(zhǔn)編號與名稱,及標(biāo)準(zhǔn)的有效性。由表可知,這些標(biāo)準(zhǔn)最早發(fā)布于1987年,最晚發(fā)布于2001年,且部分標(biāo)準(zhǔn)已經(jīng)被廢止了。
表 1-2:我國漢字編碼字符集輔助集的基本情況
欲詳細(xì)了解我國漢字編碼字符集輔助集的標(biāo)準(zhǔn)情況的請進(jìn)入。
二、輔助集介紹
1、圖形字符
我們知道,編碼字符集中的字符,包括控制字符和圖形字符。在漢字編碼字符集輔助集中,編碼的均是圖形字符。所謂圖形字符是指具有可見的表示,通常是手寫的、打印的或顯示的,它包括常用符號(各種字母、數(shù)字、序號、運(yùn)算符號等等)和漢字(簡體字、繁體字等)。當(dāng)然,在漢字編碼字符集輔助集中,圖形字符重點(diǎn)是指漢字字符(唯有第一輔助集(GB/T 12345-90)中有常用符號)。各輔助集所編碼的圖形字符及數(shù)量詳見下表2-1-1;下表2-1-2匯總了各輔助集所編碼的漢字來源及與基本集的關(guān)系。
表 2-1-1:輔助集所編碼的圖形字符及數(shù)量
表 2-1-2:各輔助集所編碼的漢字來源及與基本集的關(guān)系
2、編碼
各輔助集的編碼,同基本集(GB/T 2312)一樣,均采用雙字節(jié)編碼,無論是在七位代碼系和八位代碼系,它們遵從的是GB/T 2311規(guī)定的編碼表示。兩個(gè)字節(jié)中,位于前面的高位字節(jié)為第一字節(jié),位于后面的低位字節(jié)為第二字節(jié)。
代碼表縱向分成94個(gè)區(qū),每個(gè)區(qū)橫向分成94個(gè)位。區(qū)的編號為1~94,由高位字節(jié)標(biāo)識;位的編號也為1~94,為低位字節(jié)標(biāo)識。代碼表中的任何一個(gè)圖形字符的位置可用它所在的區(qū)號與位號標(biāo)識。關(guān)于區(qū)號和位號在七位代碼系和八位代碼系的對應(yīng)關(guān)系詳見下表2-2中。
表 2-2:各輔助集關(guān)于區(qū)號和位號在七位代碼系和八位代碼系的對應(yīng)關(guān)系
欲詳細(xì)了解上述我國漢字編碼字符集輔助集標(biāo)準(zhǔn)原文的請進(jìn)入。
三、輔助集的使用
我國發(fā)布了諸多漢字編碼字符集輔助集的標(biāo)準(zhǔn),在當(dāng)時(shí)為信息交換用漢字編碼字符集的應(yīng)用起到了一定的作用,對更多的漢字(包括簡體字、繁體字及異體字)進(jìn)行了編碼。雖然這些標(biāo)準(zhǔn)仍然有效,但其使用率越來越低,這是因?yàn)椋?/span>
首先是,諸多輔助集為使用者帶來諸多的不便,要使用諸多的標(biāo)準(zhǔn)。其次是,在1995年我國又發(fā)布了《漢字內(nèi)碼擴(kuò)展規(guī)范(GBK,1.0版)》(技監(jiān)標(biāo)函[1995] 229號)。在該規(guī)范中,已收錄了包括基本集(GB 2312-1980)、第二輔助集(GB/T 7589-1987)和第四輔助集(GB/T 7590-1987)中的簡化漢字及它們對應(yīng)的繁體字(包括第一輔助集(GB/T 12345)、第三輔助集(GB/T 13131-1991)和第五輔助集(GB/T 13132-1991))。關(guān)鍵是,在2000年我國又發(fā)布了GB 18030-2000《信息技術(shù) 信息交換用漢字編碼字符集 基本集的擴(kuò)充》(它同時(shí)代替了GBK)。該標(biāo)準(zhǔn)收錄了更多的編碼漢字,它既向下兼容原有的基本集(包括輔助集)和GBK中的編碼漢字,同時(shí)向上支持國際標(biāo)準(zhǔn)UCS/Unicode中的CJK統(tǒng)一漢字。隨著GB 18030標(biāo)準(zhǔn)的不斷修訂,GB 18030收錄的漢字最為齊全,已成為我國最權(quán)威的漢字編碼字符集。
欲具體了解上述漢字編碼字符集介紹的請進(jìn)入:GBK;GB 18030;UCS;Unicode
欲進(jìn)一步了解我國常用到的漢字編碼字符集介紹的請進(jìn)入。