一、引述
1、關(guān)于域名系統(tǒng)(DNS)
我們知道,互聯(lián)網(wǎng)(Internet)是一個(gè)基于開放互連協(xié)議的網(wǎng)絡(luò),其域名系統(tǒng)(DNS,Domain Name System)是互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施之一,是用于識(shí)別和定位互聯(lián)網(wǎng)上主機(jī)的層次結(jié)構(gòu)式的字符標(biāo)識(shí),與互聯(lián)網(wǎng)的IP地址相對(duì)應(yīng)。基于域名系統(tǒng)(DNS可)以提供WWW服務(wù)、郵件服務(wù)和和FTP服務(wù)等應(yīng)用。
欲詳細(xì)了解互聯(lián)網(wǎng)域名系統(tǒng)(DNS)介紹的請(qǐng)進(jìn)入。
2、關(guān)于國(guó)際化域名(IDN)
國(guó)際化域名(IDN,Internationalized Domain Names)也稱多語(yǔ)種域名,是指非英語(yǔ)國(guó)家為推廣本國(guó)語(yǔ)言文字的域名系統(tǒng)的一個(gè)總稱。這是因?yàn)椋ヂ?lián)網(wǎng)的域名系統(tǒng)(DNS)起始是采用的ASCII編碼字符(包括英文字母(a~z)、阿拉伯?dāng)?shù)字(0~9)及連接符(-)等)所構(gòu)成的域名字段,此時(shí)也稱為LDH-DNS系統(tǒng)(LDH即字母(Letter)、數(shù)字(Digit)和連接符(Hyphen)的首字母)。然而隨著互聯(lián)網(wǎng)在非英語(yǔ)國(guó)家的迅猛發(fā)展,非英語(yǔ)國(guó)家也有權(quán)使用自己的文字字符來(lái)構(gòu)成DNS的域名字段(據(jù)了解全球有63.5%的互聯(lián)網(wǎng)用戶的母語(yǔ)并不是英語(yǔ)),有助于互聯(lián)網(wǎng)在本國(guó)的落地、發(fā)展和應(yīng)用,這使得國(guó)際化域名(IDN)應(yīng)用而生。
互聯(lián)網(wǎng)的標(biāo)準(zhǔn)化組織-互聯(lián)網(wǎng)工程任務(wù)組(IETF)在1999年11月的第46屆IETF會(huì)議上成立了一個(gè)關(guān)于多語(yǔ)種域名的興趣小組(BOF);在2000年3月的第47屆IETF會(huì)議上正式成立了多語(yǔ)種域名工作組(IDN Working Group),來(lái)研究制定多語(yǔ)種域名的相關(guān)技術(shù)標(biāo)準(zhǔn)。2003年3月8日,IETF正式公布了與IDN相關(guān)的三個(gè)標(biāo)準(zhǔn):RFC 3490、RFC 3491和RFC3492,至此,經(jīng)過(guò)全球技術(shù)專家共同討論且被廣泛接受的多語(yǔ)種域名技術(shù)標(biāo)準(zhǔn)最終定稿。這三個(gè)IDN相關(guān)標(biāo)準(zhǔn)的名稱與作用列于下表1-2-1中,這三個(gè)標(biāo)準(zhǔn)分別解決了應(yīng)用支持多語(yǔ)種域名的技術(shù)框架、多語(yǔ)種域名編碼范圍和預(yù)處理方法、多語(yǔ)種編碼與多語(yǔ)種域名傳輸編碼之間的轉(zhuǎn)換算法等問(wèn)題。它們和后來(lái)發(fā)布的RFC 3454《Preparation of Internationalized Strings(國(guó)際化字符串預(yù)處理)》、RFC 5890《INDA:Definitions Document Framework(國(guó)際域名與應(yīng)用(IDNA):定義和文檔結(jié)構(gòu)》等共同構(gòu)成了整個(gè)國(guó)際化域名(IDN)的技術(shù)體系。下表1-2-2列舉了國(guó)際化域名(IDN)的一些特點(diǎn)。
表 1-2-1:IETF相關(guān)IDN標(biāo)準(zhǔn)的情況
表 1-2-2:國(guó)際化域名(IDN)的特點(diǎn)
二、中文域名(CDN)
1、由來(lái)
中文域名(CDN,Chinese Domain Name)即采用中文字符構(gòu)成域名字段的域名。CDN屬于IDN,是IDN在中國(guó)的應(yīng)用(嚴(yán)格來(lái)講是在華語(yǔ)地區(qū)的應(yīng)用)。隨著互聯(lián)網(wǎng)的發(fā)展,中文用戶的數(shù)量不斷增加,對(duì)于使用中文域名的需求也在增加,因此中文域名(CDN)系統(tǒng)應(yīng)用而生,使域名中的字段可以采用中文字符,帶來(lái)了LDH-DNS與CDN系統(tǒng)共存的勢(shì)態(tài)。鑒于此,中文域名(CDN)技術(shù)由此而生。
2、異同
這是因?yàn)椋形挠蛎?/span>CDN)系統(tǒng)與傳統(tǒng)的LDH-DNS系統(tǒng)有較大的差別,表現(xiàn)在:一是域名字段分隔符(中文句點(diǎn)和英文句點(diǎn))不同;二是中文字符有多種形式(如包括簡(jiǎn)體、繁體、異體、古體等,這些統(tǒng)稱為中文字體的“變體”);三是中文域名的編碼字符集比ASCII編碼字符集大很多很多(注意:ASCII編碼字符集的標(biāo)準(zhǔn)是ISO 10646或我國(guó)的GB/T 1988;中文字符集的標(biāo)準(zhǔn)是GB 18030,并兼容Unicode編碼字符集);等等。
欲具體了解相關(guān)字符集內(nèi)容介紹的請(qǐng)進(jìn)入:ASCII編碼字符集;中文字符集;Unicode字符集
然而,CDN系統(tǒng)與LDH-DNS系統(tǒng)的域名字段的構(gòu)成形式是基本相同的。所謂域名字段即域名中由分隔符隔開的幾個(gè)部分。如一個(gè)完整的LDH-DNS域名“www.gxzj2.com”中,由“www”、“txrzx”、“com”分別為三個(gè)域名字段構(gòu)成。那么一個(gè)完整的CDN字段“通信人在線.中國(guó)”中,是分別由“通信人在線”、“中國(guó)”兩個(gè)中文域名字段構(gòu)成。
欲詳細(xì)了解域名字段構(gòu)成與要求的請(qǐng)進(jìn)入。
3、誕生
事實(shí)上,對(duì)于中文域名(CDN)技術(shù)的誕生和推廣,我國(guó)做了大量的工作,尤其是中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC,China Internet Network Information Center)、工信部所屬的相關(guān)研究機(jī)構(gòu)及一些企業(yè)等單位。在CNNIC的大力推動(dòng)下,于2000年我國(guó)推出了中文域名,開始試驗(yàn),當(dāng)時(shí)IDN還沒有IETF國(guó)際標(biāo)準(zhǔn),瀏覽器無(wú)法默認(rèn)支持,實(shí)現(xiàn)方式就是給瀏覽器安裝地址欄插件。下表2-3搜集了相關(guān)中文域名(CDN)技術(shù)發(fā)展的大事件,以供通信人了解。
表 2-3:中文域名(CDN)技術(shù)發(fā)展的大事件
4、標(biāo)準(zhǔn)化
中文域名(CDN)技術(shù)要IDN一樣需要標(biāo)準(zhǔn)化,以利于CDN技術(shù)的發(fā)展、應(yīng)用。所謂中文域名(CDN)技術(shù)是指:為使CDN應(yīng)用而采用的設(shè)計(jì)、架構(gòu)、算法、規(guī)則、管理的技術(shù)總稱。因此,為了規(guī)范CDN的使用,讓中文用戶能夠方便的通過(guò)DNS來(lái)使用互聯(lián)網(wǎng)的各種應(yīng)用服務(wù),我國(guó)研究、制定并發(fā)布了關(guān)于CDN技術(shù)的許多標(biāo)準(zhǔn)。首先早在2010年開始發(fā)布其通信行業(yè)標(biāo)準(zhǔn):YD/T 2142(總體技術(shù))、YD/T 2143-2010(編碼技術(shù))和YD/T 2438-2012(字表技術(shù))等。為了使CDN很好與國(guó)際接軌,有關(guān)中文域名(CDN)技術(shù)的標(biāo)準(zhǔn)又于2004年起發(fā)布為國(guó)家標(biāo)準(zhǔn),包括GB/T 44266(總體技術(shù))、GB/T 44270(注冊(cè)技術(shù))、GB/T 44278(解析技術(shù))、等等,以支持中文域名的解析、編碼、注冊(cè)和管理,進(jìn)而推動(dòng)CDN的應(yīng)用、發(fā)展與普及。
需要指出的是:實(shí)現(xiàn)對(duì)中文域名(CDN)的支持首先應(yīng)對(duì)實(shí)現(xiàn)對(duì)國(guó)際化域名(IDN)的支持。因此GB/T 44266和YD/T 2142等CDN技術(shù)標(biāo)準(zhǔn)參照了IETF 的標(biāo)準(zhǔn)RFC 3490《國(guó)際化域名與應(yīng)用》和RFC 3743《國(guó)際化域名的注冊(cè)管理指南》等,這兩個(gè)RFC文檔是針對(duì)中日韓的文字字符存在異體的問(wèn)題而設(shè)計(jì)的。根據(jù)RFC 3490 和RFC 3743,以及我國(guó)的實(shí)際情況而起草制定了CDN技術(shù)的我國(guó)相關(guān)標(biāo)準(zhǔn),在技術(shù)內(nèi)容上與RFC 3490 和RFC 3743 保持一致,實(shí)現(xiàn)GB/T 44266和YD/T 2142等標(biāo)準(zhǔn)與實(shí)現(xiàn)RFC 3490 和RFC 3743 的結(jié)果是一樣的,是將有關(guān)國(guó)際化域名的規(guī)定轉(zhuǎn)化成針對(duì)中文域名的規(guī)定,以符合中國(guó)國(guó)情。要實(shí)現(xiàn)對(duì)我國(guó)相關(guān)CDN標(biāo)準(zhǔn)的支持,亦可直接參照RFC 3490 和RFC 3743。
欲詳細(xì)了解IETF相關(guān)國(guó)際化域名標(biāo)準(zhǔn)具體內(nèi)容的請(qǐng)進(jìn)入:RFC 3490;RFC 3743
三、中文域名(CDN)技術(shù)的關(guān)鍵技術(shù)
依據(jù)國(guó)家標(biāo)準(zhǔn)GB/T 44266《中文域名總體技術(shù)要求》,中文域名(CDN)技術(shù)包括下述四項(xiàng)關(guān)鍵技術(shù)(需要詳細(xì)了解GB/T 44266標(biāo)準(zhǔn)具體內(nèi)容的請(qǐng)查閱下附件3)。另外,在介紹下述內(nèi)容之前需要先了解幾個(gè)中文域名(CDN)的相關(guān)術(shù)語(yǔ),包括:中文域名字段(CDL)、通用字符編碼、ZONE、域名槽、CDL包等,其含義匯于下表3-0中。
表 3-0:中文域名(CDN)的相關(guān)術(shù)語(yǔ)與定義
附件 3:GB/T 44266《中文域名總體技術(shù)要求》
1、中文域名的解析技術(shù)
解析技術(shù)就是確立一個(gè)如何在應(yīng)用中實(shí)現(xiàn)CDN或者在應(yīng)用環(huán)境中使用CDN的協(xié)議框架。該框架最核心的內(nèi)容是規(guī)定了如何在整個(gè)域名系統(tǒng)(DNS)解析體系中支持CDN,該框架稱為中文域名與應(yīng)用(CDNA,Chinese Domain Name in Applications)。CDNA的技術(shù)特征詳見下表3-1。
表 3-1:CDNA的技術(shù)特征
欲詳細(xì)了解中文域名解析技術(shù)具體要求的請(qǐng)進(jìn)入。
2、中文域名的編碼技術(shù)
中文域名與應(yīng)用(CDNA)規(guī)定了支持CDN 的架構(gòu),在該架構(gòu)中就涉及到中文域名字符的編碼。對(duì)于通用字符編碼,就是根據(jù)其位置和碼位來(lái)識(shí)別字符,給每個(gè)字符(包括中文字符等)提供的一個(gè)唯一的數(shù)字。中文域名的編碼技術(shù)就是規(guī)范在互聯(lián)網(wǎng)上使用CDN的編碼方法,包括字符串預(yù)處理框架和中文域名字段預(yù)處理的框架。框架中:采用了Punycode 編碼,Punycode 是一種為國(guó)際化多語(yǔ)種域名設(shè)計(jì)的一種簡(jiǎn)單高效的轉(zhuǎn)換編碼方法,Punycode 是 Bootstring 算法的一個(gè)特例,Bootstring 的通用算法,來(lái)用基礎(chǔ)碼位表示大字符集中的碼位串。Punycode和Bootstring是由IETF RFC 3492所規(guī)范,適用于 IDNA,而CDNA的實(shí)現(xiàn)應(yīng)支持IDNA。
欲詳細(xì)了解中文域名編碼技術(shù)具體要求的請(qǐng)進(jìn)入。
3、中文域名的字表技術(shù)
所謂中文域名(CDN)的字表技術(shù)是指注冊(cè)中文域名(CDN)是參照的注冊(cè)表以及該字表相應(yīng)的使用方法規(guī)則。中文域名(CDN)注冊(cè)字表提供域名注冊(cè)和管理時(shí)使用的注冊(cè)字符范圍,以及字符對(duì)應(yīng)簡(jiǎn)體、繁體和異體之間的映射關(guān)系。中文域名注冊(cè)字表分為兩個(gè)表,第一個(gè)字表中建議字欄是“建議簡(jiǎn)體字符”,第二個(gè)字表中建議字欄中是“建議繁體字符”。
欲詳細(xì)了解中文域名字表技術(shù)具體要求的請(qǐng)進(jìn)入。
4、中文域名的注冊(cè)技術(shù)
中文域名(CDN)的注冊(cè)技術(shù)即中文域名注冊(cè)的核心算法,包括域名的轉(zhuǎn)碼機(jī)制、生成機(jī)制和域名注冊(cè)協(xié)議等技術(shù)。該算法的實(shí)現(xiàn)是通過(guò)“可擴(kuò)展的供應(yīng)協(xié)議(EPP)”來(lái)具體實(shí)施的。EPP 是一個(gè)有狀態(tài)的XML 協(xié)議,它能夠被部署在多層傳輸協(xié)議上。在底層安全協(xié)議的保護(hù)下,客戶端交換標(biāo)識(shí)、授權(quán)和選擇信息,然后約束與一系列客戶發(fā)起的“命令-響應(yīng)”交換。所有的EPP 響應(yīng)具有原子性(沒有局部成功和局部失敗),也因此具有冪等性(重復(fù)執(zhí)行一個(gè)命令與成功執(zhí)行一次對(duì)系統(tǒng)狀態(tài)具有同樣的效果)。
欲詳細(xì)了解中文域名注冊(cè)技術(shù)具體要求的請(qǐng)進(jìn)入。
中文域名(CDN)是我國(guó)互聯(lián)網(wǎng)域名體系中的重要組成部分。我國(guó)互聯(lián)網(wǎng)域名體系包括英文域名和中文域名,在其管理上,同樣是重點(diǎn)對(duì)頂級(jí)域名(TLD)及其之下的二級(jí)域名的管理。
欲進(jìn)一步了解我國(guó)互聯(lián)網(wǎng)域名體系與管理要求的請(qǐng)進(jìn)入。
875.77KB