http://www.zdnet.com.tw/news/hardware/0,2000085676,20145799,00.htm

中國在全球超級電腦速度排行榜上躋身第二名,一部分要拜特製的Nvidia繪圖晶片之賜,而英特爾也正研究如何運用這種技術跟上高效能運算的新趨勢。

中國的「星雲」(Nebulae )超級電腦位於最近剛建好的深圳國家超級計算中心,根據Linpack基準測試結果,每秒鐘可執行1.271千兆級浮點運算(petaflops),榮登全球500大超級電腦(Top500)排行榜亞軍。最新的排名周一在德國漢堡舉行的國際超級運算會議上正式宣布,冠軍仍是田納西州Oak Ridge國家實驗室的Cray系統「Jaguar」。

新聞稿指出,中國的「星雲」拿下第二名,「一部分是因為採用Nvidia GPU (繪圖處理器) 加速器...星雲號稱在理論上可達到逼近每秒鐘3 petaflop的巔峰速度--這將是歷年來TOP500之冠。」

「星雲」也採用英特爾的Xeon處理器,但這些是所謂的商品化處理器(commodity processor),也用於一般的標準伺服器電腦。英特爾雖然已取消開發Larrabee繪圖晶片的計畫,但仍研究一項運用 Larrabee研發成果的技術。英特爾周一表示,第一款這樣的產品,代號「Knights Corner」,將用22奈米製程技術生產,在每顆晶片上封裝超過50個處理核心。

我在周二訪問了田納西大學電機工程與電腦科學系教授Jack Dongarra,他也是創新運算實驗室的主任。Dongarra向我介紹Linpack基準測試。

問:超級電腦採用GPU加速器,將是一股日益盛行的趨勢嗎?

Jack Dongarra答:看起來這會成為高效能運算的模式之一。把商品化處理器(例如標準的英特爾或AMD伺服器級處理器)集結起來,搭配使用特製的加速器,就這個例子而言是用繪圖處理器。

問:GPU一般來說能提昇多少效能?

答:Nvidia主機板能比商品化處理器提供更大的效能。

問:但必須寫程式利用它才行,否則也不會發生,對嗎?

答:這不是自動的,必須寫程式把資訊傳至GPU,指示GPU怎麼做。這可能很容易,也可能很難。在大多數情況下,寫一個有效率的程式來從事這些運作,是一大挑戰。一部分問題在於電腦商品化部分與繪圖處理器之間的連繫是一個非常薄的管線,所以你在傳送大量資訊時必須考量到這個問題。而且,一旦你把它移到那裡,你必須執行許多運作,才能獲得一些效益。

問:GPU超級運算的未來展望如何?

答:會發生兩件事。一,連結會稍微改善。而未來終會發生的是,繪圖處理器將被整合到商品化處理器。所以,你將擁有一顆晶片,同時具有商品化處理器的核心,以及嵌入晶片本身的繪圖處理器或用來做浮點運算的加速器。許多公司正朝這條路邁進,例如英特爾和AMD。如此一來可提供最佳的效能,但晶片設計也必須改良。

arrow
arrow
    全站熱搜

    weihsinchiu 發表在 痞客邦 留言(0) 人氣()