在計算機發展史中,信息的表示方式經歷了從文本格式、腳本語言到二進制編碼的變化。現在標記語言己經成為最高級的信息表示方式。HTML是一種常用的標記語言,用于Web瀏覽器。XHTML和XML (Extensible Markup Language)是新近出現的標記語言,它們現在已經應用到通信業務的提供、計費信息的記錄、網絡管理系統、自動語音業務腳本語言等各個方面了。 信息表示技術常用技術的中英文對照詳見下表1。
表1:信息表示技術常用技術的中英文對照(12種)
超文本標記語言(HTML,Hyper Text Markup Language)是專門為WWW上客戶與服務器共同識別的一種語言,是標準通用標記語言(SGML)的一個延伸,是一種由標識來表示某些特性或功能的描述語言。另外還有一些其它的標記語言,包括LaTex、RTF和Frame。標記語言通過給每一種應用附上特殊的“標簽”來區分文本域。可以使用HTML在文檔間建立超文本鏈接以提供傳輸機制。通過用與其它文檔相關的代碼來標記文檔以在Internet上實現交互,這樣就形成了WWW。
HTML是由WWW的管理員或主頁的設計者編寫出來的HTML文本文件,存放在由Internet服務器軟件HTTPD指定的存放位置,如Document Root所指定目錄。如果你是WWW的管理員,在建立WWW服務器時,一般都要規定你的HTML存放目錄,即服務器配置文件都要指定Document Root的目錄位置,并且缺省運行的主HTML文件一般是index.html、in-dex.html或defaut.html等。
HTML的元素由HTML1.0、HTML2.0、HTML3.0、HTML3.2以及Netscape的擴展元素組成。
通信作為一個實時系統來設計,過去考慮的一直是如何對信息的使用和編碼進行優化。隨著硬件的快速發展和日益成熟,如何將信息按協議格式編碼或者對數據庫進行二進制編碼就不那么重要了。因為源于互聯網設計思想的文本編碼方式簡單易懂,它己經在數據庫信息表示、協議信息編碼和遠程呼叫等方面得到了普遍的應用。
目前應用在通信網絡中的有(X)HTML(Extensible Hyper Text Markup Language)、XML及XML的演進技術,包括VoiceXML、SOAP、UDDI、WSDL、IPDR和CPL。目前,內容標記語言的典型應用范例是無線標記語言(WML),在歐洲它被作為無線應用協議(WAP,Wireless Application. Protocol )標準的一部分,另外還有日本在i-Mode數據業務中使用的縮略版的HTML。 WAP正處于版本升級中,2.0版本以XHTML為基礎,并對標準中的WML作了較大的變動。
HTML很難擴展(比如增加新的標記元件),而且編碼格式比較松散,有時沒有加入結束標記也可讓Web瀏覽器正確地顯示信息。相比之下,XHTML具備擴展性,其編碼格式也要更嚴格些。HTML被定義成一個SGML DTD,而XHTML是用XML DTD來定義的。XML來源于SGML,但定義了比SGML更嚴格的標記規則。
HTML并不是一種純標記語言,它與XML的不同在于XML標記中沒有包含顯示信息。XML是一種純粹的語義定義語言,HTML則是一種混合語言,標記中含有元素的顯示信息(像粗體、斜體和文本顏色等),而(X)HTML還要在某種程度上考慮與HTML的后向兼容。