網格(Grid)組成的構想源于電力供應網,其基本思路是使用戶在應用網格計算時,就像日常生活中從電網中獲取電能那樣,可以方便地獲取高性能的計算能力。圖1給出了電力網和網格組成的示意比較。通常人們在使用電力時,并不知道電是從哪個發電站送來的,也無需知道電是通過什么型號的發電設備產生的,不論是采用火力發電,還是水力發電或核反應發電,表現的形式為無形的電能。網格也希望如此,最終使人們可以從有形的計算機系統向使用者提供無形的計算能力。
圖1:電力網和網格組成的比較
1、網格和網格計算
網格是一個集成的計算與資源環境,也就是說網格是一個計算資源池。除了必要的各種類型的計算機、網絡通信平臺之外,計算資源池涵蓋了計算資源、存儲資源、通信資源、軟件資源、信息資源、知識資源等,甚至還包括與人文相關的專家資源的集合。網格計算(Grid Computing)廣義的定義就是基于網格對問題求解的過程。顯然,上述所給出的網格和網格計算概念相對是抽象的。狹義定義中的網格資源主要是指分布的計算機資源,而網格計算是指將分布的計算機組織起來協同解決復雜的科學與工程計算問題。
可見從工程實施意義上,網格是繼傳統因特網(Internet)、萬維網(WWW)之后的新一代因特網環境集成及應用。傳統因特網實現了計算機硬件的連通,Web 實現了網頁的連通,而網格則試圖實現因特網上所有資源的全面連通,形成對用戶相對透明的虛擬的高性能計算環境,最終實現網絡虛擬環境上的資源共享和協同工作,消除信息孤島和資源孤島。因此,網格是信息社會的網絡基礎設施,是把整個因特網整合成一臺無形的超級虛擬計算機,實現因特網上所有資源的互聯、互通,完成各類資源智能共享的一種新型的分布式計算技術。
2、網格的現實意義
網格技術的起源可以追溯到20世紀90年代初。當時,歐洲的一批科學家將分布在法國和瑞士等國不同地理位置的計算資源,包括CPU、存儲器、數據庫等通過高速的因特網組成充分的資源集成,使其具有一種更高性能計算、管理及服務的資源能力,來解決高能物理研究中的計算難題。其結果是,位于瑞士的科技人員可以通過網格將巨大的計算任務提交到位于法國的高性能計算機集群上完成,這預示著:世界上計算機不管是大型、小型,還是個人的,都可以連在一個共有的開放式的因特網上,將因特網上所有的計算機設備集成起來形成一個虛擬的超級計算機系統不再是一種夢想,這就是網格技術產生的背景。
促使網格技術產生的因素主要有如下幾點:
1)隨著人們對各種學科研究領域的深入拓展,對解決問題所需的計算能力大幅度增加。如在建立數字化人腦數據庫的研究中,若將人腦體素的分辨率定在微米級,則建立一個彩色數字化人腦數據庫的數據量將達4.5 PB(1P=1015)。如果當前硬盤的容量為100 GB,則一個彩色數字化人腦數據庫就需45 000塊硬盤。
2)因特網上的計算能力(如CPU)很多都處于閑置狀態,眾多計算機高級處理能力僅僅用于上網瀏覽網頁或做簡單的文字處理對計算資源是一種浪費。
3)因特網特別是瀏覽器已可進行較為復雜的操作,從而為網格實施資源分配、任務調度等運作過程提供了條件。
網格概念的提出從根本上突破了以往計算資源利用的種種限制(如地理位置),使之成為以共享和協作方式迅速、方便解決復雜問題的基本工具。
3、網格的組成和特征
網格計算系統主要包括網格節點、網格系統軟件、網格應用,如圖2所示。網格節點是地理上獨立的計算和信息中心。網格系統軟件對網格計算系統的組成起著關鍵的作用,軟件統一管理計算網格(Computational Grid),將各個節點集成起來,組成一個虛擬協同高性能計算環境,向社會大眾和各領域的科研機構統一提供高性能計算和海量信息處理服務。網格應用是以生物、氣象、能源、石油、水利、軍事等行業的重大應用為背景建立的應用。
圖2:網格計算系統的基本組成
網格計算系統具有資源分布性、管理多重性、動態多樣性、結構可擴展性等特征,其節點及各種資源分布于不同的地方,隸屬于不同的所有者,具有多層管理的特點。為了完成特定的工作,各種各樣的異構資源可動態組合,規模可不斷加大。
1)分布性
分布與共享是網格的一個主要特征。網格的分布性首先指的是網格資源是分布的,但又是共享的。可以認為:分布是網格硬件在物理上的特征表現,而共享則是在網格軟件支持下實現的邏輯上的特征。
2)多樣性
網格資源是多樣的和異構的。網格中的信息技術資源多種多樣,不僅有各種類型的超級計算機,甚至包括各種尖端科學儀器,如光譜分析儀、天文望遠鏡等都可以聯接到網格環境中,由這些機器產生的科學數據可以直接傳輸到網格上去,從而實現跨越地理分布的多個管理域。
3)動態性
與Internet 類似,網格也是一個開放性的信息載體。它可以從最初包括的少數資源發展到具有成千上萬資源的大網格。網格資源的動態變化要求提高網格的可擴展性,自適應性。網格的設計與實現時,必須注重網格的可擴展性。與一般的因特網及單機結構不相同的是,網格系統由于地域分布和系統的復雜性使其整體結構經常發生變化。網格同樣可能發生障礙,但由于網格系統的動態適應能力很強,能夠在特殊情況下自動將用戶的請求轉發給正常的子系統來完成。
4)管理復雜性
與因特網的域管理機制類似,網格系統中的各種資源屬于不同的機構與組織,網格資源應具有自治性的。但網格資源也必須能提供統一管理,具有互操作特征,因此,管理網格系統的管理機制更為復雜。
5)自相似性
分形模型的一個重要特征是自相似性。網格的局部和整體之間也存在著一定的相似性,這對于構建和研究網格技術有十分重要的意義。
以WWW為代表的因特網技術在給人們帶來了很多方便的同時,其固有的缺陷也暴露無疑。人們常用信息垃圾山來形容Internet的現狀,這是由Internet自身特性所決定的:Internet是一個開放性的系統,人們在網上發布信息時,幾乎沒有任何限制;Internet實行的所謂域管理及分散管理機制,缺乏一個統一的網絡管理神經中樞,所以導致整個網絡體系處于無序的狀態。
相比之下,網格是高性能計算機、信息源、因特網3種技術的有機組合,具有更高性能的知識生產、一體化和資源共享功能。具體包括:
1)網格比WWW具有更大的帶寬和更高的信息傳輸速度。
2)可提供高級數據處理能力。
3)可提供有效的廣域緩存技術支持。
4)擁有更大的網上社區。
除此之外,網格在處理信息方面與WWW質的區別還在于:因特網本身主要起信息載體的功能,并不創造和生產知識,而網格卻能根據用戶的要求自動地生產知識與信息。在知識生產過程中,網格的高性能計算機能將數據源(傳感器、貴重設備、數據庫、信息庫)中得到原始數據通過特定網格程序軟件加工成信息知識。而且這一功能是完全由網格本身完成,不需要人為干預。另外與WWW的信息孤島效應不同,在邏輯上,整個網格就像一臺計算機在運作,充分體現了它的一體化和高度綜合性功能,而不像WWW那樣從成千上萬個網址中漫無邊際地查找。