一、中文域名注冊技術的因由
中文域名注冊(CDNR,Chinese Domain Name Registration)技術是指:在中文域名(CDN)注冊時,域名所采用的轉碼機制、生成機制和注冊協議等技術的總稱。中文域名注冊(CDNR)技術是中文域名(CDN)系統的關鍵技術之一。CDN系統之所以要采用CDNR技術主要是因為CDN采用了更大的字符集。
我們知道,通常的域名系統(DNS)是采用的ASCII編碼字符(包括英文字母、阿拉伯數字及連接符(-)等)以構成的域名字段,常稱為LDH-DNS系統(LDH即字母(Letter)、數字(Digit)和連接符(Hyphen)的首字母)。若域名注冊采用LDH-DNS時就簡單很多。然而,當采用中文域名(CDN)注冊時,由于使用了既包含LDH字符又包含了龐大的中文字符在內的通用字符集,關鍵是對于中文字符集,又存在多種變體(如簡體、繁體、異體、古體等)字形,使得CDN注冊時變得異常復雜,應采取相應的注冊技術(域名的轉碼技術、生成技術和相應地注冊協議等技術),以支撐CDN在互聯網上的使用,包括儲存、傳輸、顯示等。
二、關于中文域名與應用(CDNA)
1、CDNA概述
中文域名注冊技術是基于中文域名與應用(CDNA,Chinese Domain Name in Applications)協議的。CDNA是指如何在應用程序以及某些應用環境中使用或者實現中文域名的協議。這是我國專門為實現中文域名(CDN)而設計開發的一種框架協議,其最核心的內容是規范了如何在整個DNS解析體系中支持中文域名(CDN)。該協議具體是由我國國家標準GB/T 44278《中文域名解析技術要求》所規范,它參照了IETF的RFC 3490《國際化域名與應用(IDNA)》等國際標準,RFC 3490文檔是針對中日韓的文字字符存在異體的問題而設計的。因此,中文域名與應用(CDNA)是實現CDN的基礎框架,包括有CDN的注冊機制、編碼機制、解析機制等等。在下述CDNA介紹時要用到相關術語,如:區(ZONE)、解析器、ASCII編碼兼容(ACE)前綴、中文域名字段(CDL)包、域名槽等,其含義詳見下表表 2-1。
表 2-1:中文域名與應用(CDNA)的相關術語與定義
欲詳細了解GB/T 44278標準具體內容的請進入。
2、CDNA內涵
下表2-2-1給出了CDNA的技術特征。依據CDNA的要求,只要某種應用(如DNS ZONE文件和解析器接口等)支持LDH字符,應可使用CDNA來支持CDN。需要使用域名解析時,應在應用和解析器之間使用CDNA;需要在域名寫入DNS ZONE時,應在域名放入ZONE之前使用CDNA。
表 2-2-1:中文域名與應用(CDNA)技術特征
中文域名與應用(CDNA)允許使用某些LDH字符(以特殊前綴開始)來標識非LDH字符。非ASCII 形式的域名字段可用ASCII編碼兼容(ACE,ASCII Compatible Encoding)前綴開始的ACE 形式表示。ASCII編碼兼容(ACE)前綴也稱LDH編碼前綴。用于中文域名的ACE前綴是由兩個LDH字符(xn)后跟著兩個連字符(- -)來表示的前綴,即:“x n - -”(其中字母部區分大小寫)。后綴是UNICODE 字串的Punycode 編碼。Punycode 是一種為國際化多語種域名設計的一種簡單高效的轉換編碼方法(由TETF RFC 3492規范)。下表2-2-2列出了Punycode 編碼的特征。
表 2-2-2:Punycode 編碼的特征
欲具體了解Punycode 編碼介紹的請進入。
3、CDNA規定的轉碼機制
為了中文域名(CDN)在相關應用進行使用,中文域名與應用(CDNA)規定了兩種轉碼機制,也稱之為兩種操作:LDH字符轉換操作(也稱A-label轉換操作)和通用字符編碼轉換操作(也稱U-label轉換操作)。兩者的用途可詳見下表2-3。兩種轉換操作中,A-label轉換操作可能會失??;如果對某個域名使用LDH字符轉換操作失敗,則此域名不應作為CDN使用,相應的有一些錯誤處理。在進行兩種轉換操作前,域名的編碼格式應是通用字符編碼,如果域名使用其它編碼方式,應將轉換成通用字符編碼(LDH字符碼位也屬于通用字符編碼碼位)。所謂通用字符編碼是指根據其位置或碼位來識別字符,給每個字符提供的一個唯一的數字。CDNA要求,通用字符編碼采用ISO 10646所規范的通用字符編碼的字符集。
表 2-3:LDH字符轉換操作和通用字符編碼轉換操作的用途
欲具體了解通用字符編碼字符集介紹的請進入。
三、中文域名注冊技術要求
在我國國家標準GB/T 44270《中文域名注冊技術要求》中規定了中文域名(CDN)注冊相關域名的轉碼機制、生成機制和注冊協議等技術要求,以支持CDN注冊時適應互聯網域名系統(DNS)的相關要求。下述簡要介紹之,若要詳細了解該標準具體內容的請查閱下附件。
附件:GB/T 44270-2024《中文域名注冊技術要求》
1、CDN的轉碼機制
之所以要實施轉碼,是因為為了使采用了更大字符集的中文域名字段(CDL)字符編碼以適應互聯網域名系統(DNS)的LDH字符編碼。CDN的轉碼機制應滿足中文域名與應用(CDNA)協議的要求,即采用兩種轉碼機制:A-label轉換操作和U-label轉換操作。需要注意的是:一是中文域名與應用(CDNA)應支持國際化域名與應用(IDNA)的相關要求(即RFC 3490的要求)。二是任何確定的DNS字段的長度不能大于63個八位字節;中文域名轉碼機制中包含“x n - - ”在內字符的總長度不能大于63個ASCII字符。
關于轉碼后的中文域名的顯示:支持CDNA的應用應支持LDH和非LDH兩種形式顯示中文域名。CDN用戶可選擇LDH形式的顯示方式或者非LDH形式的顯示方式,缺省配置是后者。LDH形式的CDN比較難理解,CDN應盡量減少這種形式的顯示。
2、CDN的生成機制
在中文域名(CDN)中要用到中文字符。中文字符存在著“變體”也稱“異體”,這樣可能導致某些中文字符可能被認為是同一個字符,但在計算機使用的字符集中,同一個概念上的字符卻通過幾個不同的碼位來識別(如“國”的碼位是U+56FD;“國”的碼位是U+570B)。外形相同的字符,或者是有相同或相似語義卻被分配了不同碼位的字符有可能使用戶產生混淆。中文域名標準也會影響到一些互聯網協議及其應用,增加了技術管理與服務方面的復雜性,在中文域名部署時有必要提高警惕來防止混淆與欺詐行為。為此,中文域名的具體生成機制,也即中文域名的注冊管理機制應按照我國國家GB/T 44266中的相關要求。在GB/T 44266標準的第5章,給出了中文域名的注冊管理算法框架的總體技術要求。
欲詳細了解GB/T 44266標準具體內容的請進入。
3、CDN的注冊協議
中文域名(CDN)注冊協議是基于“可擴展的供應協議”(EPP,Extensible Provisioning Protocol)的。生成機制包括其注冊管理算法的實現是通過EPP來具體實施的。EPP是一個由狀態的XML協議(可擴展標記語言協議),它能夠被部署在多層傳輸協議上。在底層安全協議的保護下,客戶端交換標識、授權和選擇信息,然后約束一系列客戶發起“命令-響應”交換。所有的EPP 響應具有原子性(沒有局部成功和局部失?。?,也因此具有冪等性(重復執行一個命令與成功執行一次對系統狀態具有同樣的效果)。關于EPP協議的具體內容請查閱GB/T 44270標準原文,即本文的附件。
欲進一步了解我國中文域名管理要求的請進入。
774.02KB