Geçen ay 2 GPU'nun ai işlerindeki karşılaştırmalı benchmarkını yapmıştım. Sonuçları kendim zaten merak ediyordum kendim için yapacaktım ancak yapmışken bir de düzgün grafik, tablo, grafik açıklaması, ya bu çok ayrıntı olur bunu çıkarayım derken hafta geçmiş. Sürekli benchmark yapıp yayınlayanlara Allah yardım etsin.
Merak edenlere link: https://medium.com/@alperenkaban/rtx-4090-vs-5090-ai-i%C5%9F-y%C3%BCklerinde-ne-kadar-fark-var-1b40faa40ceb
Ayrıca her türlü feedback'e açığım.

BeğenFavori PaylaşYorum yap
  • Chevron @chevron

    GPU içinde darboğaz oluşması konusunu açabilir misiniz ? bunun ortalaması "kart performansı" değil mi zaten ?

    • Alperen @byalperen

      GPU içinde darboğaz derken GPU'nun kendi içinde bir bileşenin (örneğin bellek band genişliği, tensor çekirdek sayısı, vram kapasitesi vb.) başka birimlerin hızını sınırlaması durumu, örneğin pytorch kullanarak yaptığınız bir deep learning projesinde 16 gb varm olan kart için batch boyutunu çok büyük tutup vram i aşarsanız gpu tensor çekirdeklerinin kullanımı %10 bile olmayacaktır çünkü kartın hızını sınırlayan başka bir durum oluyor orda. Oyunlar için de benzer durum var nvidia insight ile profiling denen işlem yapılır oyunda karelerin çiziminde hangi işlemlerin daha fazla zaman almış eğer ciddi bir orantısızlık varsa (yani darboğaz olan bileşen varsa) onun yükü azaltılır. Ama her ekran kartı aynı yapıda olmadığı için bu işlem her kartı aynı etkilemiyor, zincirin en zayıf halkası mantığı. Genel ortalama elbette vardır ama gerçek dünyadaki iş yüklerinde GPU’da hangi bileşenin darboğaz yaratacağını bilmek çok daha net proje yönetimine imkan verir. Çünkü adamın birisi sadece cs 2 oynuyorsa o adamı genel ortalama ilgilendirmez sadece o oyunun değeri ilgilendirir. "Ortalama" kişiden kişiye değişiyor. Biraz dağınık oldu ama anlatabilmişimdir umarım.

    • Chevron @chevron

      @byalperen detay bilgi gerçekten. kolay gelsin.