| 綜述 現(xiàn)在,高性能計算(High Performance Computing -- HPC)解決了世界上最為復(fù)雜和艱巨的計算難題,并且能夠輕松處理。氣象建模、模擬撞車試驗、人體基因繪圖以及核爆炸模擬等多種與人類生命相關(guān)的重要領(lǐng)域都要用到HPC。突飛猛進的性能、急劇下降的成本以及勢如潮涌的需求等眾多因素,促使HPC迅速走出科學(xué)研究實驗室,步入主流商業(yè)領(lǐng)域。英特爾不但提供了商業(yè)化/即時可用(Commercial, Off-the-shelf -- COTS)技術(shù)解決方案,而且還在致力于聯(lián)合業(yè)界主要廠商和服務(wù)提供商,共同部署和支持上述要求苛刻的系統(tǒng)。通過將臺式機、集群和大型SMP系統(tǒng)的性能進行完美結(jié)合,HPC正在步入網(wǎng)格計算時代,它將使任何人都能隨時隨地、經(jīng)濟高效地進行計算。 從科研領(lǐng)域到主流產(chǎn)業(yè) 短短幾年時間里,在大型PC集群上并行運行科學(xué)和技術(shù)應(yīng)用的實踐已經(jīng)從幕后走到臺前,成為一種主流趨勢。1994年,NASA*工程師在Goddard飛行中心建造了第一個由Linux*系統(tǒng)電腦組成的小型集群-“Beowulf”。他們的成功激發(fā)人們的對此的廣泛興趣,很快,類似的集群便在全球各地的大學(xué)和政府實驗室投入運行。 1997年,桑地亞(Sandia)國家實驗室*和英特爾公司合力打造出了ASCI Red-世界上第一臺TFLOP計算系統(tǒng)(每秒執(zhí)行一萬億次浮點計算)。作為美國能源部(DOE)高級戰(zhàn)略計算計劃的一部分,這個大規(guī)模并行處理系統(tǒng)成了第一批采用COTS組件建造的真正的超級計算機之一。與此同時,康奈爾理論中心*開始用Microsoft* Windows*和英特爾架構(gòu)服務(wù)器組成的集群,替換其RISC架構(gòu)超級計算機。這一舉措標志著COTS集群從此進入了商業(yè)應(yīng)用領(lǐng)域。 今天,幾大領(lǐng)先制造商,尤其是專業(yè)解決方案提供商都在提供英特爾架構(gòu)COTS集群系統(tǒng),并配有完備的商用軟件和全面產(chǎn)品支持。眾多企業(yè)都被其幾乎不可抗拒特性和優(yōu)勢所打動,并爭相進行部署。除政府、教育和國家實驗室等公共部門之外,HPC在制造、金融、能源、生命科學(xué)和數(shù)字媒體等行業(yè)都廣受青睞。 網(wǎng)格:分布式計算的又一次浪潮 廣受歡迎的網(wǎng)格計算已被視為下一代分布式計算的標志。網(wǎng)格擴展了基于標準的開放式集群平臺的概念,可以支持任何互連的計算設(shè)備之間進行協(xié)作 – 甚至將擴展到全球任何一個角落。網(wǎng)格囊括了臺式電腦、部門級服務(wù)器、大型SMP系統(tǒng)和大型數(shù)據(jù)中心服務(wù)器,能夠以空前的規(guī)模效益提供更為經(jīng)濟的資源。網(wǎng)格技術(shù)可將計算資源進行“虛擬”組合,并可以不限地點、硬件類型和操作系統(tǒng)的差異使它們協(xié)同工作,從而實現(xiàn)總體性能大于各部分相加的整體優(yōu)勢。 全世界正在興建一種工作網(wǎng)格平臺,將眾多國家實驗室、大學(xué)和工業(yè)實驗室連到一起。其中的重要開發(fā)資源包括美國萬億次網(wǎng)格計算(TeraGrid)、歐盟網(wǎng)格計劃以及新加坡生物信息學(xué)院網(wǎng)格系統(tǒng)。同時,網(wǎng)格技術(shù)已經(jīng)不可避免地與正在開發(fā)的互聯(lián)網(wǎng)服務(wù)交付標準(即網(wǎng)絡(luò)服務(wù)標準)相融合。互聯(lián)網(wǎng)分布式計算這種綜合性技術(shù)即將浮出水面,它將使全球數(shù)以百萬計的系統(tǒng)作為一個巨大無比的計算資源來運行,并允許遍布全球的用戶靈活地進行高性能技術(shù)計算。 通過把大量客戶機作為網(wǎng)格的入口并開發(fā)開放的標準,任何組織都可以對臺式機、集群或大型SMP系統(tǒng)上的閑置計算資源加以利用。這將大大提高總體計算性能,并在實時訪問信息的基礎(chǔ)上取得更先進的成果。 英特爾引領(lǐng)HPC與早期的網(wǎng)格部署 下面介紹一些近期內(nèi)出現(xiàn)的,基于英特爾架構(gòu)或業(yè)界領(lǐng)先技術(shù)的HPC集群和網(wǎng)格部署情況。 Ÿ企業(yè)級網(wǎng)格:Novartis –挑戰(zhàn):在一年之內(nèi)以低于10倍的成本,將領(lǐng)先優(yōu)勢及規(guī)模提高10倍。 –試驗重點:首次用7天時間完成以前需要3.18年才能完成的處理任務(wù)。對超過600臺windows臺式機進行無縫整合,降低累積帶寬消耗量。 Ÿ合作伙伴級網(wǎng)格:TeraGrid –此類網(wǎng)格成員使用擁有13.6 TFLOP處理能力的3300節(jié)點分布式計算網(wǎng)格,進行分子建模、氣候和大氣模擬以及能源研究等領(lǐng)域的研究。 Ÿ公共網(wǎng)格:探索癌癥療法 –與國家癌癥研究基金會和牛津大學(xué)的合作項目證明,這種革命性的科學(xué)計算可用于探索癌癥療法。 –由于無與倫比的響應(yīng)能力,將可處理的項目規(guī)模擴大100倍以上,成為目前最大的計算化學(xué)研究項目。 Ÿ太平洋西北國家實驗室 –挑戰(zhàn):在環(huán)境研究、能源、保健和國家安全等研究領(lǐng)域要想獲得突破性進展,必須擁有超凡的處理性能 –解決方案:在716個惠普*節(jié)點內(nèi)部署1432顆英特爾®安騰®2處理器,將實現(xiàn)超過9 TFLOPS的性能。 Ÿ路易斯安那州大學(xué)(LSU) –挑戰(zhàn):氣象學(xué)的研究工作要求超強的處理性能,LSU需要使用世界上最快的超級計算機。 –解決方案:1024顆英特爾至強處理器在Atipa Technologies*的512節(jié)點Linux集群上運行,以滿意的價格為該大學(xué)提供提供超過2.2 Teraflops的性能。 Ÿ戴姆勒克萊斯勒 –挑戰(zhàn):創(chuàng)新的模擬撞車試驗解決方案需要更短的“結(jié)果算出時間”(計算出結(jié)果所需的時間縮短20%),并替代三臺超級計算機。 –解決方案:采用英特爾®至強™處理器的108節(jié)點IBM*集群保持了極高的分析精確度,而成本卻只是以前系統(tǒng)的60% Ÿ康奈爾理論中心 –挑戰(zhàn):需要頂級的性能以減輕計算密集型工程建模方面的計算瓶頸。 –解決方案:采用英特爾®奔騰®處理器及Microsoft Windows*操作系統(tǒng)的730節(jié)點Dell*集群可提供所需的性能、可靠性和支持。 英特爾在網(wǎng)格和HPC領(lǐng)域的作用 作為業(yè)界HPC解決方案標準構(gòu)建模塊的領(lǐng)先供應(yīng)商,英特爾是全球眾多設(shè)備制造商、軟件開發(fā)商、系統(tǒng)集成商和服務(wù)提供商的動力核心,這些廠商基于開放的標準體系結(jié)構(gòu)全力打造一流的解決方案。在與業(yè)界的通力合作下,基于英特爾的HPC設(shè)備已經(jīng)實現(xiàn)了優(yōu)異的性能、可擴充性、靈活性和升級能力–而成本只是基于RISC的專有HPC集群和超級計算機的幾分之一。英特爾戰(zhàn)略的核心組成部分包括: 技術(shù)構(gòu)建模塊 英特爾可提供支持HPC集群和網(wǎng)格的全套構(gòu)建模塊:處理器;性能增強的芯片組合服務(wù)器平臺、互連技術(shù)和廣泛的開發(fā)軟件。 英特爾平臺 ·高性能臺式機–主頻高達3.06 GHz并支持超線程技術(shù)的英特爾®奔騰®4處理器可為組建經(jīng)濟的集群和分布式對等臺式機環(huán)境提供理想的平臺。英特爾®NetBurst™微體系結(jié)構(gòu)采用32位體系結(jié)構(gòu),支持創(chuàng)新的HPC。 ·高價值工作站–英特爾Ò至強Ô處理器可為雙處理器集群節(jié)點提供完美平衡的性能、可靠性、靈活性和價值。英特爾NetBurst體系結(jié)構(gòu)和超線程技術(shù)的完美結(jié)合可為要求苛刻的應(yīng)用提供更短的響應(yīng)時間、更高的處理速率和更強勁的性能。 ·服務(wù)器–英特爾至強處理器MP專為大型多路SMP應(yīng)用設(shè)計—是要求每個節(jié)點都具有更高處理能力的集群應(yīng)用的絕佳選擇。通過英特爾NetBurst體系結(jié)構(gòu)和超線程技術(shù)與大容量集成式3級高速緩存相結(jié)合,可為32位處理器提供無與倫比的性能。 ·高端集群–英特爾Ò安騰Ò 2處理器可提供大規(guī)模浮點執(zhí)行資源,從而能夠支持最繁重的技術(shù)處理工作負載。64位顯式并行指令計算(EPIC)體系結(jié)構(gòu)結(jié)合高達3 MB的集成式三級高速緩存可提供更高的處理速度和更充足的內(nèi)存訪問空間?煽啃蕴匦园ㄔ鰪婂e誤探測和糾錯機制,以及高級系統(tǒng)檢測體系結(jié)構(gòu),能夠避免造成數(shù)據(jù)丟失、破壞和停機。 英特爾系統(tǒng)構(gòu)件模塊 ·英特爾芯片組具有平衡的體系結(jié)構(gòu),支持為完善英特爾處理器而度身定制的系統(tǒng)總線、內(nèi)存和互操作性帶寬。芯片組還具備出色的可靠性、可用性、可擴充性和可管理性等諸多高級特性,可確保實現(xiàn)獨立的、無故障的運行。 ·英特爾服務(wù)器平臺幾乎是一種完全盒裝的服務(wù)器系統(tǒng),由英特爾采用一流的構(gòu)件模塊設(shè)計而成,可為系統(tǒng)集成商提供極為可靠、可擴展和可管理的平臺,并能針對多種應(yīng)用輕松進行現(xiàn)場配置,包括安裝高密度集群。 低延遲互連技術(shù) ·InfiniBand*體系結(jié)構(gòu)是支持信道式交換結(jié)構(gòu)和互操作性互連技術(shù)的業(yè)界標準,其最大優(yōu)點在于能夠降低外部存儲訪問和進程間信息發(fā)送的延遲,從而顯著提高集群性能。 軟件:英特爾開發(fā)商工具和服務(wù) ·英特爾編譯器支持OpenMP*標準和自動并行性,能夠簡化和加快線程應(yīng)用的開發(fā),并針對采用英特爾處理器的系統(tǒng)來優(yōu)化性能。 ·英特爾性能庫提供了針對英特爾處理器而優(yōu)化的眾多功能,可加快開發(fā)速度,降低成本并提高應(yīng)用性能。 ·英特爾線程工具來自英特爾KAI軟件實驗室,它可以簡化多線程應(yīng)用的開發(fā),從而充分利用多線程技術(shù)和OpenMP并行編程模式。其主要特性包括自動檢測線程錯誤和提供直觀的性能瓶頸視圖。 ·英特爾®并行應(yīng)用中心(PAC)提供了具有領(lǐng)先水平的實驗環(huán)境,獨立軟件廠商(ISV)可以利用它來改進基于英特爾的 |