凱利,G.

[拼音]:juxing jisuanji

[英文]:supercomputer

在一定時期內速度最快、效能最高、體積最大、耗資最多的計算機系統。巨型計算機是一個相對的概念,一個時期內的巨型機到下一時期可能成為一般的計算機;一個時期內的巨型機技術到下一時期可能成為一般的計算機技術。現代的巨型計算機用於核物理研究、核武器設計、航天航空飛行器設計、國民經濟的預測和決策、能源開發、中長期天氣預報、衛星影象處理、情報分析和各種科學研究方面,是強有力的模擬和計算工具,對國民經濟和國防建設具有特別重要的價值。

據統計,計算機的效能與使用價值的平方成正比,即所謂平方律。按照這一統計規律,計算機效能越高,相對價格越便宜。因此,隨著大型科學工程對計算機效能要求的日益提高,超高效能的巨型計算機將獲得越來越大的經濟效益。

發展概況

50年代中期的巨型機有 UNIVAC公司的LARC機和 IBM公司的 Stretch機。這兩臺計算機分別採用了指令先行控制、多個運算單元、儲存交叉訪問、多道程式和分時系統等並行處理技術。60年代的巨型機有CDC6600機和7600機,它們都配置有多臺外圍處理機,主機的中央處理器含有多個獨立並行的處理單元。70年代出現了現代巨型計算機,其指令執行速度每秒已達5000萬次以上,或每秒可獲得2000萬個以上的浮點結果。

現代巨型機經歷了三個發展階段。第一階段有美國ILLIAC-Ⅳ(1973年)、STAR-100(1974年)和ASC(1972年)等巨型機。ILLIAC-Ⅳ機是一臺採用64個處理單元在統一控制下進行處理的陣列機,後兩臺都是採用向量流水處理的向量計算機。1976年研製成功的CRAY-1機標誌著現代巨型機進入第二階段。這臺計算機設有向量、標量、地址等通用暫存器,有12個運算流水部件,指令控制和資料存取也都流水線化;機器主頻達80兆赫,每秒可獲得8000萬個浮點結果;主儲存器容量為100~400萬字(每字64位),外儲存器容量達109~1011字;主機櫃呈圓柱形,功耗達數百千瓦;採用氟里昂冷卻。圖中為這種機器的邏輯結構。中國的“銀河“億次級巨型計算機(1983年)也是多通用暫存器、全流水線化的巨型機。運算流水部件有18個,採用雙向量陣列結構,主儲存器容量為200~400萬字(每字64位),並配有磁碟海量儲存器。這些巨型機的系統結構都屬於單指令流多資料流(SIMD)結構。80年代以來,採用多處理機(多指令流多資料流MIMD)結構、多向量陣列結構等技術的第三階段的更高效能巨型機相繼問世。例如,美國的CRAY-XMP、CDCCYBER205,日本的S810/10和20、VP/100和200、S×1和S×2等巨型機,均採用超高速門陣列晶片燒結到多層陶瓷片上的微組裝工藝,主頻高達50~160兆赫以上,最高速度有的可達每秒5~10億個浮點結果,主儲存器容量為400~3200萬字(每字64位),外儲存器容量達1012字以上。

還有一類專用性很強的巨型機。例如,美國哥德伊爾宇航公司的巨型並行處理機MPP,由16384個處理器組成128×128的方陣,專用於衛星影象資訊的高速處理,8位整數加的處理速度可達每秒60億次,32位浮點加可達每秒1.6億次。英國ICL公司研製的分散式陣列處理機專用系統DAP,由 4096個一位微處理器和一臺大型系列機2900組成,最高速度可達每秒1億個64位的浮點結果。

巨型機技術

並行處理是巨型機技術的基礎。為提高系統性能,現代巨型機都在系統結構、硬體、軟體、工藝和電路等方面採取各種支援並行處理的技術。

資料型別

為便於高速並行處理,中央處理器的資料型別除傳統的各類標量外,都增加了向量或陣列型別。向量或陣列運算的實質,是相繼或同時執行一批同樣的運算,而標量運算只處理一個或一對運算元,故向量運算速度一般比標量運算速度快得多。

硬體結構

現代巨型機硬體大多采用流水線、多功能部件、陣列結構或多處理機等各種技術。流水線是把整個部件分成若干段,使眾多資料能重疊地在各段操作,特別適於向量運算,效能-價格比高,應用普遍。多功能部件可以同時進行不同的運算,每個部件內部又常採用流水線技術,既適合向量運算又適合標量運算。中國的“銀河”機和日本的 VP/200、S810/20機進一步將每個向量流水部件或向量處理機加倍,組成雙向量陣列,又把向量運算速度提高了兩倍。美國CYBER-205機的向量處理機可按使用者需要組成一、二或四條陣列式的流水線,技術上又有所發展。多處理機系統以多臺處理機並行工作來提高系統的處理能力,各臺處理機可以協作完成一個作業,也可以獨立完成各自的作業。每臺處理機內部也可採用各種適宜的並行處理技術。在任務的劃分與分配、多處理機之間的同步與通訊和互連網路的效益等方面,多處理機系統尚存在不少問題有待解決。現代巨型機採用的主要還是雙處理機系統(如CRAY-XMP)和四處理機系統(如HEP)。

向量暫存器

為降低儲存流量和頻頻寬度的要求,並解決短向量運算速度低的問題,第二階段的巨型機採取了向量暫存器技術。CRAY-1機設有8個向量暫存器,所有向量運算指令都面向向量暫存器和其他通用暫存器。為更有力地支援各運算流水部件高度並行地進行各自的向量運算,日本的VP/100和S810等第三階段的巨型機設有龐大的向量暫存器,總容量達64K位元組。

標量運算

標量運算速度對巨型機系統綜合速度的影響極大。為此,除增設標量暫存器、標量後援暫存器或標量高速緩衝儲存器以及採用先進的標量控制技術(如先行控制等)外,還可採用專作標量運算的功能部件和標量處理機等技術。例如,CRAY-1機的多功能部件中,有6個專作標量和地址運算,3個兼作標量浮點運算,標量運算速度可達每秒2000萬次以上;CYBER205機專設標量處理機,含5個運算部件,標量運算速度可達每秒5000萬次以上。在提高向量運算速度的同時,進一步提高標量運算速度,儘可能縮小兩者的差距,已成為改善巨型機系統性能的重要研究課題。

主儲存器

為使複雜系統的三維處理成為可能,要求主儲存器能容納龐大的資料量。80年代的巨型機容量已達256兆位元組。為與運算部件的速度相匹配,主儲存器必須大大提高資訊流量。為此,主要的措施是:

(1)採取較成熟的多模組交叉訪問技術,模組數量一般取2n,有的巨型機採用素數模新技術,以儘量避免向量訪問的衝突;

(2)不斷減小每個模組的存取週期,如CRAY-XMP機的存取週期為38納秒,S810機雖用靜態MOS儲存器,也只有40納秒,與雙極儲存相當;

(3)增加主儲存器的訪問埠,如CRAY-XMP機的每臺處理機與CRAY-1機相比,訪問埠由一個增加到四個,解決了儲存訪問的瓶頸問題。

輸入輸出通道

巨型機不但配有數量較多的輸入輸出通道,如16~32個,而且具有較高的通道傳輸率。如CRAY-XMP機除一般通道外,還有兩個傳輸率為每秒100兆位元組的通道和一個傳輸率高達每秒1250兆位元組的通道。

固態海量儲存器

為適應特大算題的大量資料在主儲存器和外儲存器之間的頻繁排程,新型的巨型機採用固態海量儲存器作為超高速外儲存器。CRAY-XMP機的固態儲存器採用MOS技術,容量為64~256兆位元組,傳輸率比磁碟快50~100倍。S810機的固態儲存器容量為256~1024兆位元組,傳輸率達每秒1000兆位元組。

大規模積體電路

巨型機的邏輯電路都採用超高速ECL電路,門級延遲約為0.25~0.5納秒,晶片門數為幾十至一千以上;1984年日本已研製成功4K門陣列常溫砷化鎵晶片,級延遲約為50皮秒;用於向量暫存器的超高速雙極隨機存取儲存器的訪問時間為3.5~5.5納秒。

組裝工藝

縮短機內走線長度和提高機器主頻,是提高巨型機速度的基礎。現代巨型機主頻有的已達 250兆赫以上。為此,除提高晶片的整合度和速度外,還採用微組裝等高密度多層組裝工藝。由此而來的散熱問題很突出,需要採取特殊的冷卻措施。

並行演算法和軟體技術

為充分發揮巨型機的系統性能,必須研究各種並行演算法並研製並行化的軟體系統。針對特大型科學計算的特點,巨型機通常配置如下軟體:具有多重處理能力的批處理分散式作業系統、高效的組合語言、向量FORTRAN或PASCAL、ADA語言和向量識別器、並行化標準子程式庫、科學子程式庫和應用程式庫、系統實用程式、診斷程式等。

參考書目

D.J.Kuck,TheStructureofComputersand Computations,John Wiley & Sons.,New York,1978.

F. Sumner,SupercomputerSystemsTechnology,Series 10,No.6,Pergamon Infotech Limited,England,1982.

Kai Hwang andFaye A.Briggsr,Computer Architecture and Parallel Processing,McGraw-Hill Inc.,New York,1984.