NVIDIA 宣布發表全新系列Tesla® 繪圖處理器(GPU),並搭載革命性的NVIDIA® Kepler GPU 運算架構,不僅讓GPU加速運算更加簡易,也讓更廣泛的高效能運算(HPC)科學和科技應用能加以運用。

新款NVIDIA Tesla K10與K20 GPU是專為處理全球最複雜的HPC運算難題打造的加速器。Kepler架構專為高效能與超高省電效率設計,其效率是前一代NVIDIA Fermi™架構的3倍。NVIDIA Fermi™架構在兩年前推出時,曾在平行運算樹立全新性能標竿。

NVIDIA 首席科學家Bill Dally表示:「Fermi是運算領域中的一大躍進,它在高效能運算領域的第一線確立了GPU加速運算的價值,並吸引數十萬開發者加入GPU運算平台。由於GPU不僅容易運用、應用領域廣泛且具有高效率的特性,全新的Kepler架構將發揮相同的顛覆性,把GPU帶入廣大的運算領域。」

Tesla K10與K20 GPU已於本周登場的GPU技術大會(GTC)上發表。其他重大發布,皆可至GTC 線上新聞室參閱。

NVIDIA 開發了一套創新架構技術,讓Kepler GPU具備高效能與高能源效率,並適合更多的開發者及更廣泛的應用。各項重大創新包括:

Ÿ   SMX串流多重處理器:作為每個GPU的基本建構元件,SMX串流多重處理器須重新設計,藉以達到高效能與能源效率的目標。它能提供較Fermi串流多重處理器快高達3倍的每瓦效能,能實現在僅10個伺服器機架的空間中,打造一部運算效能達1 petaflop的超級電腦。SMX能達到如此高的能源效率,是因為CUDA核心增加了4倍,同時又降低每個核心的時脈速度,並且在閒置模式時透過電源閘控的方法關掉部分GPU電路,盡可能使作為平行處理核心的GPU範圍最大化,而非僅作為控制邏輯電路。

Ÿ   Dynamic Parallelism:這項功能讓GPU執行緒能機動跨越到新的執行緒,讓GPU能針對資料進行動態調整。它大幅簡化了平行處理的程式撰寫工作,讓GPU能針對更廣泛的熱門演算法提供加速,例如自適性網格精緻化、快速多偶極演算法、以及多重格點演算法等。

Ÿ   Hyper-Q:這項技術讓多個CPU核心能同時運用單一Kepler GPU內的多個CUDA核心。如此即可大幅提高GPU使用率,縮減CPU的閒置時間並促進可編程性。Hyper-Q非常適合用在採用MPI訊息傳遞介面的叢集應用程式。

NVIDIA(輝達)公司GPU工程部資深副總裁暨Kepler首席工程師Jonah Alben表示:「我們在設計Kepler時鎖定三項目標: 效能、效率及可及性。它代表GPU加速運算的一大里程碑,並將帶動下一波運算研究的突破發展。」

NVIDIA Tesla K10 K20 繪圖處理器

NVIDIA Tesla K10 GPU能針對訊號、影像及地震資料處理等應用提供全球最高的資料吞吐量。專為油氣探勘與國防工業等客戶進行最佳化的單Tesla K10加速板,內含兩顆GK104 Kepler GPU,能使單精度浮點運算尖峰效能達4.58 teraflop,並提供每秒320 GB的記憶體頻寬。

NVIDIA Tesla K20 GPU是Tesla GPU產品系列的全新旗艦產品,專為運算密度最高的高效能運算環境量身打造。Tesla K20預期將成為全球最高效能、最省電的GPU,預計將於2012年第四季問市。

Tesla K20搭載GK110 Kepler GPU,這款GPU的雙精度運算速度較搭載Fermi架構的Tesla產品快3倍以上,並支援Hyper-Q與Dynamic Parallelism功能。GK110 GPU預計將被運用在由美國田納西橡樹嶺國家實驗室打造的全新Titan超級電腦,以及伊利諾州立大學香檳分校國家超級電腦應用中心打造的Blue Waters系統。

IDC高效能運算部門專案副總裁Earl C. Joseph表示:「自Fermi發表後兩年以來,各界開始廣泛運用混合運算技術,讓眾多關鍵的高效能運算應用能達到更高的效能。在未來兩年,我們估計將有越來越多的GPU運用,讓GPU在許多應用中發揮更高的效能。」

CUDA 5平行編程平台預覽版

除了Kepler架構外,NVIDIA 同時發表CUDA 5平行編程平台的預覽版。此平台將提供給超過2萬個NVIDIA GPU運算註冊開發者計畫的會員,將讓開發者開始探索各種方法利用新款Kepler GPU的各項優勢,包括動態平行處理。

CUDA 5平行編程模型預計在2012年第三季全面供應。開發者可至CUDA網站加入GPU運算註冊開發者計畫,即可取得預覽試用版。

作者: 阿爽