Kapat
Reklam Alanı
twitter takipçi satın al
Reklam Alanı
youtube izlenme satın al
PCIe tabanlı Tesla V100 hızlandırıcısı duyuruldu
Donanım 0

PCIe tabanlı Tesla V100 hızlandırıcısı duyuruldu

Grafik teknolojileri sektörünün tanıtılmış en dinç ekran kartı olma özelliği içeren Tesla V100 hızlandırıcısı, bu hafta bundan başka PCIe üstünde şekillenmiş ve görünümü bir ekran kartı haline gelmiş yeni tasarımı ile karşımızda.

 

Nvidia hızlandırıcıyı ilk tanıttığında SXM2 adını verdiği form faktörüne sahip versiyonu göstermişti. Daha yaygın dilekçe için ise PCIe versiyonu da piyasaya sürülecek. İki versiyon arasında bazı manâlı farklar mevcut.

 

Ayrıca Bkz.Çift kameralı Samsung telefonları çoğalıyor

İlk olarak SXM2 formunda Nvidia en yüksek iletişim performansını veren NVLINK teknolojisini kullanıyordu. PCIe tabanlı ekran kartında ise mevcut yok. İkincisi ise saat frekansları ve operasyon performansı bir miktar daha düşük. Bu sayede TDP değeri 300W seviyesinden 250W seviyesine çekilmiş. Gerçekte ufak bir düşüş fakat enerji tasarrufu açısından önemli bir uzaklık kat edilmiş.

 

üstelik bir ekran kartı görünümüne büründüğü için çift slotlu bir hava soğutma sistemi ekleme imkanı doğmuş. Bu da üçüncü fark olarak öne çıkıyor. Bunların açık havada iki versiyon arasında görünen bir ayrım değil.

 

Tesla V100

 

Volta mimarisinin en büyük ve en kuvvetli çekirdeği GV100, Tesla V100 hızlandırıcısına güç veriyor. 21 milyar transistör barındıran çekirdeğin çeper alanı 815 milimetrekare. Boyutları büyümesi bir yana özellikle suni akıl teknolojileri alanında kayda değer yeniliklerle geliyor.

 

GV100 çekirdeğinde 84 adet SM birimi bulunuyor. Bu SM birimlerinde 64 adet CUDA çekirdeği yer alıyor. Ayrıntılarıyla açık birimde 5376 adet FP32 CUDA çekirdeği, 2688 adet FP64 CUDA çekirdeği yer alıyor. 1370MHz taban hız 1455MHz seviyesine sürat aşırtılabiliyor. Bu Nedenle FP32 işlem performansı 15 TFLOPS, FP16 işlem performansı ise 30 TFLOPS seviyesine çıkıyor. (PCIe için 1370MHz arttırılmış sürat, 14 TFLOPS FP32 performansı, 28 TFLOPS FP16 performansı)

 

Suni zekaya siklet veren Nvidia, GV100 grafik birimini bu amaçla tasarlamış. Her SM biriminde 8 adet de Tensor makine öğrenme dili çekirdeği yer alıyor. Toplamda 672 Tensor çekirdeği ortaya çıkıyor. Grafik biriminin makine öğrenme dili tabanlı matriks aritmetiklerini fazla daha akan bir şekilde hesaplayabildiği ifade ediliyor. Kartın suni zeka performansı 112 DLOPs (Deep Learning Teraflops) ama şimdiye kadar bir yonganın sunduğu en yüksek performans durumunda.

 

SM biriminde de verimlilk odaklı optimizasyonlar üretilmiş. Bir SM birimi bundan böyle 4 bloğa ayrılıyor. Her blokta 16 FP32 çekirdeği, 8FP64 çekirdeği, 16 INT32 çekirdeği, iki Tensor çekirdeği, yeni bir Düzey 0 komut önbelleği ve 64KB tescil dosyası yer alıyor. Seviye 1 önbelleği ise daha yüksek performans ve düşük gecikme için genişletilmiş. Her SM için ise 96KB’a dek paylaşılan bellek kullanılıyor.

 

Hafıza

 

Hafıza tarafında geçen sene olduğu gibi HBM2 bellek kullanılıyor. 16GB’a değin HBM2 hafıza ile 900GB/s bant genişliğine ulaşılıyor. Grafik birimi tekrar ilk olarak Tesla V100 adındaki yeni süper bilgisayar hızlandırıcısında kullanılacak. Tesla P100 hızlandırıcısında ise 720GB/s bant genişliği bulunuyordu. Erişilen hızlar gerçekte harika.

 

8 adet 512-bit hafıza kontrolcüsü ile toplamda 4096-bit hafıza veri yoluna ulaşılıyor. Her kontrolcüde 768KB Düzey 2 önbellek elde etmek üzere toplamda 6MB hafıza yer alıyor. Toplamda grafik birimi 300W ısıl tasarım gücüne sahip. (PCIe için 250W)

 

Kıyas

 

AMD yeni Vega tabanlı Radeon Instinct MI25 hızlandırıcısını tanıtırken, işlem performansı açısından Pascal tabanlı tüm grafik çekirdeklerinden daha iyi olduğunu dile getirmişti. Bu bağımsızlık Tesla V100 ile son bulacak gibi görünüyor zira Vega mimarisi bir kaç puan geride kalmış durumda. Hem Volta tabanlı ekran kartlarının Vega ekran kartlarını da geride bırakabileceği tahminini yapabiliriz. 

 

Şenol Dly {Dly Şenol}

Üniversite mezunu bir çok web sitesi ve Aslantek’ in kurucusu.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir