在計算機(jī)發(fā)展史中,信息的表示方式經(jīng)歷了從文本格式、腳本語言到二進(jìn)制編碼的變化。現(xiàn)在標(biāo)記語言己經(jīng)成為最高級的信息表示方式。HTML是一種常用的標(biāo)記語言,用于Web瀏覽器。XHTML和XML (Extensible Markup Language)是新近出現(xiàn)的標(biāo)記語言,它們現(xiàn)在已經(jīng)應(yīng)用到通信業(yè)務(wù)的提供、計費信息的記錄、網(wǎng)絡(luò)管理系統(tǒng)、自動語音業(yè)務(wù)腳本語言等各個方面了。 信息表示技術(shù)常用技術(shù)的中英文對照詳見下表1。
表1:信息表示技術(shù)常用技術(shù)的中英文對照(12種)
超文本標(biāo)記語言(HTML,Hyper Text Markup Language)是專門為WWW上客戶與服務(wù)器共同識別的一種語言,是標(biāo)準(zhǔn)通用標(biāo)記語言(SGML)的一個延伸,是一種由標(biāo)識來表示某些特性或功能的描述語言。另外還有一些其它的標(biāo)記語言,包括LaTex、RTF和Frame。標(biāo)記語言通過給每一種應(yīng)用附上特殊的“標(biāo)簽”來區(qū)分文本域。可以使用HTML在文檔間建立超文本鏈接以提供傳輸機(jī)制。通過用與其它文檔相關(guān)的代碼來標(biāo)記文檔以在Internet上實現(xiàn)交互,這樣就形成了WWW。
HTML是由WWW的管理員或主頁的設(shè)計者編寫出來的HTML文本文件,存放在由Internet服務(wù)器軟件HTTPD指定的存放位置,如Document Root所指定目錄。如果你是WWW的管理員,在建立WWW服務(wù)器時,一般都要規(guī)定你的HTML存放目錄,即服務(wù)器配置文件都要指定Document Root的目錄位置,并且缺省運行的主HTML文件一般是index.html、in-dex.html或defaut.html等。
HTML的元素由HTML1.0、HTML2.0、HTML3.0、HTML3.2以及Netscape的擴(kuò)展元素組成。
通信作為一個實時系統(tǒng)來設(shè)計,過去考慮的一直是如何對信息的使用和編碼進(jìn)行優(yōu)化。隨著硬件的快速發(fā)展和日益成熟,如何將信息按協(xié)議格式編碼或者對數(shù)據(jù)庫進(jìn)行二進(jìn)制編碼就不那么重要了。因為源于互聯(lián)網(wǎng)設(shè)計思想的文本編碼方式簡單易懂,它己經(jīng)在數(shù)據(jù)庫信息表示、協(xié)議信息編碼和遠(yuǎn)程呼叫等方面得到了普遍的應(yīng)用。
目前應(yīng)用在通信網(wǎng)絡(luò)中的有(X)HTML(Extensible Hyper Text Markup Language)、XML及XML的演進(jìn)技術(shù),包括VoiceXML、SOAP、UDDI、WSDL、IPDR和CPL。目前,內(nèi)容標(biāo)記語言的典型應(yīng)用范例是無線標(biāo)記語言(WML),在歐洲它被作為無線應(yīng)用協(xié)議(WAP,Wireless Application. Protocol )標(biāo)準(zhǔn)的一部分,另外還有日本在i-Mode數(shù)據(jù)業(yè)務(wù)中使用的縮略版的HTML。 WAP正處于版本升級中,2.0版本以XHTML為基礎(chǔ),并對標(biāo)準(zhǔn)中的WML作了較大的變動。
HTML很難擴(kuò)展(比如增加新的標(biāo)記元件),而且編碼格式比較松散,有時沒有加入結(jié)束標(biāo)記也可讓Web瀏覽器正確地顯示信息。相比之下,XHTML具備擴(kuò)展性,其編碼格式也要更嚴(yán)格些。HTML被定義成一個SGML DTD,而XHTML是用XML DTD來定義的。XML來源于SGML,但定義了比SGML更嚴(yán)格的標(biāo)記規(guī)則。
HTML并不是一種純標(biāo)記語言,它與XML的不同在于XML標(biāo)記中沒有包含顯示信息。XML是一種純粹的語義定義語言,HTML則是一種混合語言,標(biāo)記中含有元素的顯示信息(像粗體、斜體和文本顏色等),而(X)HTML還要在某種程度上考慮與HTML的后向兼容。