<rp id="m2ttn"></rp>
<cite id="m2ttn"><span id="m2ttn"></span></cite>

<b id="m2ttn"></b>

    1. <rt id="m2ttn"></rt>
      <u id="m2ttn"></u>
      <b id="m2ttn"></b>
    2. <rp id="m2ttn"><menuitem id="m2ttn"><strike id="m2ttn"></strike></menuitem></rp>
      <cite id="m2ttn"><form id="m2ttn"></form></cite>

      終極:誰最強?處理器浮點計算能力PK

      電腦雜談  發布時間:2020-11-14 02:00:42  來源:網絡整理

      顯卡浮點運算能力圖_顯卡浮點運算能力圖

      隨著AMD和NVIDIA陸續推出了浮點計算能力超過1TFlops的新產品,處理器的浮點計算能力最近已成為熱門話題。浮點計算能力一直是處理器的非常重要的指標,科學計算的能力關鍵取決于處理器的浮點計算能力。

      前一段時間,AMD即將發布的新產品RV770官方信息文檔出現在互聯網上。該文件提到兩個RV770產品的浮點計算能力超過1TFlops,而HD4850的單精度浮點計算能力達到1TFlops。 HD4870單精度浮點處理能力的高頻版本高達1.2Tflops。

      顯卡浮點運算能力圖

      請注意HD4870簡介文件的最后一行

      隨后,AMD發布了新一代的流處理卡FireStream9250。由于該卡基于RV770內核,并具有800個流處理器的計算能力,因此該卡的浮點處理能力也非常高,超過了1TFlops。

      讓我們來看看NVIDIA。本月16日,新的核心G200正式發布。流處理器的數量已達到240個。每個流處理器每單位時間可以處理3條指令,因此著色器頻率為1400MHz。在這種情況下,浮點功能可能會超過1TFlops,但不幸的是最高端的GTX 280著色器頻率僅1300MHz,浮點處理能力僅為933GFlops,不超過1TFlops。

      顯卡浮點運算能力圖

      ZOTAC推出了全球首款浮點功能超過1TFlops的GTX 280圖形卡

      NVIDIA之所以沒有突破GTX 280顯卡的1TFlops浮點處理能力,主要是因為該顯卡的熱量和功耗已經難以控制,并且可以通過改進技術來實現。和將來的其他方法。但是,顯卡制造商Zotac推出了GTX 280的超頻版本,Shader頻率設置為1400MHz,浮點處理能力自然超過1TFlops。

      顯卡浮點運算能力圖_顯卡浮點運算能力圖

      這里有個問題,為什么Zotac的GTX 280可以超過Shader的頻率達到1400MHz,而NVIDIA無法。根據我的猜測,NVIDIA首先控制功耗和發熱,因為對于重量級產品(例如G200),如果功耗和發熱太大,媒體將使NVIDIA非常面目全非??。其次,眾所周知,Zotac是世界最大的晶圓代工廠Boneng擁有自己的圖形卡品牌。博能可能專門選擇了一組體質更好的G200內核,并適當增加了它們的頻率,從而可以極大地保證圖形卡的穩定性。

      可以看出,G200的浮點處理能力仍然很強,只要稍微超頻就可以突破1TFlops標記。這就是Zotac推出超頻版GTX 280的意義。盡管公共版GTX 280并未突破1TFlops浮點計算能力,但NVIDIA推出的另一款科學計算產品Tesla L10做到了。

      顯卡浮點運算能力圖

      Tesla S1070

      Tesla S1070是一整套科學計算解決方案。簡而言之,這是一個高性能工作站。 Tesla S1070具有4個G200 GPU,每個GPU的著色器頻率達到1500MHz。根據“流處理器數量×每個流處理器同時執行的命令數量×流處理器頻率=浮點處理能力”的公式進行計算,具有240個流處理器和每個流處理器的G200 GPU可以在以下位置執行3條指令:同一時間。當頻率達到1500MHz時,單精度浮點功能可以達到1080GFlops,超過1TFlops,并且4個GPU同時運行。單精度浮點功能可以超過4TFlops。

      顯卡浮點運算能力圖

      它看起來就像一臺1U服務器

      那么NVIDIA為什么不能在公開版本的GTX 280上突破1TFlops,卻可以在Tesla S1070上實現?實際上,這很容易理解。 Tesla S1070是一整套科學計算解決方案。它具有單獨的機箱。看起來像1U服務器。只要機箱中的空間允許,NVIDIA便可以隨意使用它的散熱設備,而且這類產品的價格當然也不低,即使使用全球頂級散熱設備,NVIDIA也可以賺取可觀的利潤。因此,NVIDIA不懼怕這套設備的發熱和功耗。

      顯卡浮點運算能力圖

      顯卡浮點運算能力圖_顯卡浮點運算能力圖

      Tesla C1060

      當然,NVIDIA還推出了另一款Tesla系列科學計算卡,型號為Tesla C1060。由于這是像GTX 280這樣的獨立卡的形式,因此情況與GTX 280非常相似。發熱量,功耗和成本,著色器頻率未超過1400MHz,浮點計算能力自然未超過1TFlops

      盡管NVIDIA和AMD都突破了1TFlops的浮點計算功能,但我們談論的是單精度(FP32)計算功能。但是,就雙精度浮點處理功能而言,相對較弱盡管Tesla S1070單GPU單精度浮點處理能力超過了1T,但雙精度浮點能力只能達到大約100GFlops,大約是單精度浮點計算能力的1/10; AMD的FireStream 9250稍好一點,效率可以達到Tesla S1070的兩倍,雙精度浮點功能可以達到200GFlops。

      可以看出,GPU上雙精度浮點運算的效率仍然很低。最近,Clearspeed發布了具有96GFlops雙精度浮點計算功能的最新處理器。最令人驚訝的是,該處理器在工作時僅消耗12W的功率。 AMD的FireStream 9250可以達到200GFlops。功耗高達150W。 NVIDIA的性能甚至更差。 Tesla S1070單GPU具有僅100GFlops的雙精度浮點運算能力,但功耗高達170W。

      顯卡浮點運算能力圖

      Clearspeed發行的該處理器的型號為CSX700,其代號為“ Callanish”(蘇格蘭巨石陣)。它采用90nm工藝生產,具有2×96處理內核,頻率為250MHz,集成的256KB SRAM,糾錯硬件模塊,DDR2存儲控制器和PCI-E接口。

      顯卡浮點運算能力圖

      CATS-700

      有兩個帶有CSX700處理器的加速卡,型號為Advance e710和Advance e720(單擊型號可下載產品介紹PDF)。兩種產品具有不同的形式以適應不同的用途,但規格相同。全部具有2GB的RAM,并且所有處理器均為CSX700。除了這兩張加速卡之外,還有一個1U刀片服務器系統CATS-700(單擊模型以下載產品介紹PDF),其中包含12個e710加速卡,24G存儲系統以及總共兩倍的。精度浮點性能高達1.152TFLops。

      顯卡浮點運算能力圖_顯卡浮點運算能力圖

      每年,都會發布世界500強超級計算機的最新統計數據。最近的統計是在去年9月。作者于去年9月獲得了世界十大最快的超級計算機列表。下表:

      顯卡浮點運算能力圖

      點擊放大視圖

      從這臺全球超級計算機Top10的最新統計數據中可以看出,藍色巨人IBM占據了第一和第二位。美國能源部勞倫斯·利弗莫爾國家實驗室(LLNL)安裝的IBM Blue Gene / L系統已連續四年排名第一。但是,與以前的統計數據相比,該系統的計算能力已經改變。從以前的280TFlops到擁有212,992個處理器的478.2TFlops,它已經有了很大的改進。去年,IBM似乎已經對全球最佳超級計算機進行了重大升級;

      第二名也是IBM-Blue Gene / P System推出的產品。這是IBM去年制造的超級計算機,安裝在德國的某個地方。作者不了解具體的地名!該系統有62536個處理器,浮點處理能力為167.3TFlops;

      第三名是由SGI推出的SGI Altix ICE 8200,它安裝在新墨西哥計算應用中心(NMCAC)中,具有14,336個處理器和126.9TFlops浮點計算功能;

      第四名來自惠普。這臺超級計算機安裝在印度。它具有14,240個處理器和117.9Tflops的浮點處理能力;

      第五名也來自安裝在瑞典的惠普公司,它具有13,728個處理器,浮點處理能力為102.8TFlops;

      第六名Red Storm Cray XT3來自Sandia / Cray,具有26,569個處理器,浮點處理能力為102.2TFlops;

      顯卡浮點運算能力圖_顯卡浮點運算能力圖

      在美國安裝的第七個Cray系統具有23016個處理器,浮點處理能力為10 1.7TFlops;

      第八名也是IBM的產品。該系統安裝在美國華盛頓。它具有40960個處理器,浮點能力高達9 1.3TFlops;

      第九名是Cray系統,具有19,320個處理器,浮點處理能力為85.4TFlops。這臺超級計算機在美國;

      第十名是IBM Blue Gene系列的另一套產品,具有36864個處理器和82.2TFlops的浮點計算功能。

      實際上,在超級計算機市場上,行業巨頭之間的競爭也非常激烈。該表每年都會發生很大變化。這是去年上半年全球十大超級計算機的清單。通過比較圖片,您可能知道競爭的激烈程度(請參見下表):

      顯卡浮點運算能力圖

      此外,ISC08會議將于本月17日至20日在德國舉行,這意味著它在過去幾天中舉行。最新的統計列表應公布。如果有新聞,作者將盡快向您提供報告。

      最新進度(19日15:00更新):

      我們宣布了剛剛被列入統計的世界前500名超級計算機。好消息是,該統計信息還使超級計算機進入了千萬億次時代,在IBM Roadrunner浮點運算中排名第一。容量已達到驚人的1.026PFlops,峰值性能為1.37578PFlops(注意:1PFlops = 1000TFlops)。

      [單擊此處查看TOP10全球超級計算機] [單擊此處查看TOP500全球超級計算機]

      此外,此統計中的全球前500名超級計算機還反映了HPC未來的發展趨勢,例如多核,異構計算等。有興趣的朋友可以單擊下面的鏈接來了解:

      從TOP500超級計算機列表中看HPC的發展!


      本文來自電腦雜談,轉載請注明本文網址:
      http://www.wyantai.com/a/shenmilingyu/article-333114-1.html

        相關閱讀
        發表評論  請自覺遵守互聯網相關的政策法規,嚴禁發布、暴力、反動的言論

        熱點圖片
        拼命載入中...
      • 1
      • 2
      • 3
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • >
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 1
      • 国产亚洲精品资源在线26U