1、元數據的定義
元數據(Metadata)是描述、解釋、定位或者為更容易地進行檢索、使用或管理信息資源而進行的結構化信息。換句話講元數據是指有關數據的數據或有關信息的信息。在不同的領域,元數據有不同的用法。一些領域使用它指機器可理解的信息,另一些領域將其僅用于描述電子資源的記錄。在圖書館環境中,元數據通常應用于各類客體,包括數字的或非數字的資源描述。傳統的圖書館中使用的編目錄便是元數據的一種形式。元數據是確保資源在將來繼續存活并可接入的關鍵。元數據以非特定語言的方式描述在代碼中定義的每一類型和成員。元數據存儲以下信息,詳見下表1。
表1:元數據存儲的信息
2、元數據的種類
元數據有如下3種類型:
1) 描述型元數據:為發現和標識的目的描述資源的元數據。可以包括象標題、摘要、作者和關鍵字等元素。
2) 結構化元數據:該類元數據表明如何將構成組建組合在一起,如頁如何排序來形成章節。
3) 管理用元數據:該類元數據提供幫助管理資源的信息,象何時和如何創建文件、文件類型和其他技術上的信息以及哪些人可以接入該文件的相關信息。包括產權管理元數據(涉及智能知識產權的信息)和保留元數據(包含為存檔和保留資源所需要的信息)。
3、元數據的應用
創建描述性的元數據的主要原因之一是便于相關信息的發現。除了資源發現外,元數據可以幫助組織電子資源、方便互操作及與傳統資源集成,以及數字標識并支持存檔和保留。
1) 資源發現:在資源發現上,元數據與好的編目具有相同的功能。所完成的功能主要包括如下表3-1所示的4項。
表3-1:資源發現的功能
2) 組織電子資源:隨著電子資源信息數量的迅猛增加,利用靜態的內容列表來組織電子資源(給出資源的位置和端口)已經不能滿足業務發展的需要。利用元數據來動態組織電子資源會為用戶提供更高質量的服務。
3) 互操作:隨著數字化內容信息網絡化傳輸的應用越來越普及,跨網絡跨應用系統和平臺的業務及應用越來越多,采用相同標準的元數據可以方便信息的跨應用平臺的查找和使用。
4) 數字標識:持續地唯一標識一個客體內容的標識信息。元數據可組合一系列標識數據以便于使一個客體區別于其他不同的客體。
5)存檔和保留:隨著存儲媒體、硬件和軟件技術的改變,在未來可能會出現數字化的資源不可用的可能性,為此元數據是確保數字資源在未來可以使用的關鍵。
上面所談到的元數據的應用主要集中在對數字化資源本身的標識、組織、存檔和保留、查找以及互操作等方面。隨著Internet網絡和應用的不斷發展,利用網絡進行數字化信息的存儲、查找、使用變得越來越重要。為利用網絡進行數據信息的查詢、傳輸和應用,需要增加用于描述一些動態信息的元數據,如用戶對內容的喜好、用戶所使用的終端能力、使用的傳輸網絡的動態資源信息,以及表示相同內容信息所采用的不同的編碼壓縮方式等相關信息的元數據,以輔助用戶利用網絡查找和消費數字化的內容資源。
4、元數據相關標準的發展情況
研究和制定與元數據相關的國際標準化機構包括: ISO/IEC、W3C、IETF、ETSI和ITU等。已經制定的相關標準有下表4所列。有關元數據的國際標準規范仍在發展過程之中。
表4:已制定的相關元數據的標準列表
元數據是描述信息資源或數據等對象的數據,其使用目的在于:識別資源;評價資源;追蹤資源在使用過程中的變化;實現簡單高效地管理大量網絡化數據;實現信息資源的有效發現、查找、一體化組織和對使用資源的有效管理。
欲進一步了解數據通信系統的請進入。