DapuStor J5060 Özellikleri
| J5060 | |
|---|---|
| Kapasite (TB) | 61,44 |
| Form Faktörü | U.2 15mm |
| Arayüz | PCIe 4.0 x4, NVMe 1.4a, Çift port destekli |
| Okuma/Yazma Bant Genişliği (128K) MB/s | 7400 / 3000 |
| Rastgele Okuma/Yazma (4KB) K IOPS | 1500 / 30 (16KB) |
| 4K Rastgele Gecikme (Tip.) O/Y µs | 105 (4KB) / 33 (16KB) |
| 4K Sıralı Gecikme (Tip.) O/Y µs | 7 (4KB) / 12 (16KB) |
| Tipik Güç (W) | 23 |
| Boşta Güç (W) | 5 |
| Flaş Tipi | 3D Enterprise QLC NAND Flash |
| Dayanıklılık | 0,5 DWPD |
| MTBF | 2 milyon saat |
| UBER | 1 sektör / 10^17 bit okuma |
| Garanti | 5 yıl |
DapuStor J5060 Performansı
Kontrol Noktası Oluşturma
Dapustor J5060 SSD'nin yapay zeka eğitim ortamlarındaki gerçek dünya performansını değerlendirmek için, Argonne Ulusal Laboratuvarı tarafından geliştirilen ve derin öğrenme iş yüklerindeki G/Ç desenlerini test etmek üzere özel olarak tasarlanmış Data and Learning Input/Output (DLIO) kıyaslama aracını kullandık. Depolama sistemlerinin kontrol noktası oluşturma, veri alımı ve model eğitimi gibi zorluklarla nasıl başa çıktığına dair bilgiler sağlar. Aşağıdaki grafik, her iki sürücünün 99 kontrol noktası boyunca süreci nasıl ele aldığını göstermektedir. Makine öğrenimi modellerini eğitirken, kesintiler veya güç kesintileri sırasında ilerleme kaybını önlemek için modelin durumunu periyodik olarak kaydetmek için kontrol noktaları esastır. Bu depolama talebi, özellikle sürekli veya yoğun iş yükleri altında sağlam performans gerektirir.
Bu çalışma için seçilen platform, Ubuntu 22.04.02 LTS çalıştıran Dell PowerEdge R760'ımızdı. 13 Ağustos 2024 sürümünden DLIO kıyaslama sürüm 2.0'ı kullandık. Sistem yapılandırmamız aşağıda özetlenmiştir:
- 2 x Intel Xeon Gold 6430 (32 Çekirdek, 2,1 GHz)
- 16 x 64 GB DDR5-4400
- 480 GB Dell BOSS SSD
- Seri Kablolar Gen5 JBOF
- 61,44 TB Dapustor J5060
- 61,44 TB Solidigm D5-P5336
Kıyaslama testlerimizin gerçek dünya senaryolarını yansıtmasını sağlamak için, testlerimizi LLAMA 3.1 405B model mimarisine dayandırdık. Model parametrelerini, iyileştirici durumları ve katman durumlarını yakalamak için torch.save() kullanarak kontrol noktası oluşturmayı uyguladık. Kurulumumuz, sekiz GPU'ya dağıtılmış 4 yönlü tensör paralelliği ve 2 yönlü boru hattı paralelliği işleme ile hibrit bir paralellik stratejisi uygulayan bir 8 GPU sistemi simüle etti. Bu yapılandırma, modern büyük dil modeli eğitim gereksinimlerini temsil eden 1.636 GB'lık kontrol noktası boyutlarıyla sonuçlandı.
Genel olarak, Dapustor J5060 testin ilk aşamasında sağlam bir tutarlılık gösterdi; ilk 33 kontrol noktası için süreler yaklaşık 575,66 saniye civarındaydı. 5060J, sürücü ilk kez dolmadan önce daha yüksek performans sürdürebildi. Öte yandan, Solidigm P5336, başlangıçta J5060'tan daha yavaş olmasına rağmen, test devam ettikçe tutarlı bir performans gösterdi.
Genel ortalamaları göz önünde bulundurduğumuzda, Dapustor J5060 769,44 saniye süre kaydetti, Solidigm P5336 ise 640,17 saniye ile tamamladı. Bu, Solidigm P5336'yı kontrol noktalarını daha hızlı kaydetme açısından öne geçiriyor.
Genel olarak, Dapustor J5060 kısa süreli işlemleri iyi idare eder ancak 30 dakikayı aşan sürekli yazmalarda zorlanır. Bu arada, Solidigm P5336 uzun süreli görevler boyunca tutarlı performans için daha iyi bir sürücüdür. Dapustor J5060'ın bu zayıf yazma performansı, kontrol noktası oluşturma hızının test devam ettikçe bozulmasıyla belirgindir.
GPU Doğrudan Depolama
GPU Doğrudan Depolama, depolama aygıtları ile GPU'lar arasında CPU ve sistem belleğini atlayarak doğrudan veri aktarımını sağlayan bir teknolojidir. Geleneksel veri aktarımında, veriler depolamadan CPU'nun belleğine okunur ve ardından GPU'nun belleğine kopyalanır. Bu işlem, artan gecikmeye ve azalan performansa yol açan birden çok veri kopyasını içerir. CPU, depolama ve GPU arasındaki veri aktarımını işlemesi gerektiğinden bir darboğaz görevi görür. GDS, depolama aygıtlarının GPU belleğine ve GPU belleğinden doğrudan veri aktarmasına izin vererek bu darboğazı ortadan kaldırır.
Aşağıdaki parametrelerin her bir kombinasyonunu hem okuma hem de yazma iş yüklerinde sistematik olarak test ettik:
- Blok Boyutları: 1M, 128K, 16K
- G/Ç Derinliği: 128, 64, 32, 16, 8, 4, 1
GDSIO sonuçlarımızı incelerken, 61,44 TB Dapustor J5060 ve Solidigm P5336'nın okuma ve yazma performansını inceliyoruz.
GDSIO Sıralı Okuma Performansı
Dapustor J5060, 1M blok boyutu ve 64 ve 128 G/Ç derinliklerinde 4,2 GiB/s'lik bir tepe okuma verimi elde eder. En küçük blok boyutunda (16K), performans, G/Ç derinliği arttıkça 0,1 GiB/s ile 0,8 GiB/s arasında değişir. Bu, optimum verim için daha büyük blok boyutlarına açık bir tercih gösterir. Tepe performansı büyük blok boyutlarında elde edilir, bu da sürücünün toplu veri aktarımlarını işlemedeki verimliliğini gösterir.
Karşılaştırıldığında, Solidigm P5336 aynı blok boyutunda (1M) benzer bir maksimum verim olan 4,3 GiB/s'ye ulaştı, ancak bu performansı daha erken, 32 G/Ç derinliğinde elde etti ve daha yüksek G/Ç derinliklerinde tutarlı bir şekilde sürdürdü. Bu, Solidigm P5336 için daha geniş bir G/Ç derinliği aralığında büyük blok boyutlarını işlemede biraz daha iyi verimlilik olduğunu göstermektedir.
Daha iyi bir karşılaştırmalı görünüm sağlamak için, her iki sürücüyü karşılaştıran bir fark tablosuna sahibiz. Daha yeşil bir renk bloğu Dapustor SSD'nin avantajını gösterirken, spektrumun kırmızı tarafına doğru hareket eden bir blok bir zayıflığı gösterir. Burada, J5060, 4 ila 8 G/Ç derinlikleri hariç, 128K blok boyutunda P5336'dan daha iyi performans gösterir. Ancak, 16K ve 1M blok boyutlarında daha yüksek G/Ç derinliklerinde verim düşüşleri kaydedilir, bu da bu senaryolarda daha az verimlilik olduğunu gösterir.
Sıralı okuma gecikmesi karşılaştırmasında, Solidigm P5336, neredeyse tüm blok boyutları ve G/Ç derinliklerinde Dapustor J5060'tan sürekli olarak daha düşük gecikme süresi sağlar. 16K blok boyutunda, kuyruk derinliği arttıkça fark daha belirgin hale gelir: J5060, 128 derinlikte 2.329 μs'ye ulaşırken, P5336 1.365 μs'de daha düşük kalır. 128K'da, Solidigm çoğu derinlikte yine liderdir, yüksek yüklerdeki istisna hariç (128 derinlikte J5060'ta 4.080 μs'ye karşılık P5336'da 5539 μs). 1M blok boyutunda, her iki sürücü de beklendiği gibi gecikme artışları yaşar, ancak P5336, en yüksek kuyruk derinliğinde 29.138 μs'ye karşılık 29.512 μs ile biraz daha iyi kontrol edilir.
GDSIO Sıralı Yazma Performansı
Dapustor J5060, tüm G/Ç derinliklerinde (128K, 1 G/Ç derinliği boyutu hariç, 2.2GiB/s kaydeden) 128K ve 1M blok boyutları için 2,7 ila 2,8 GiB/s arasında tutarlı bir yazma verimi gösterir. 16K blok boyutları için performans, G/Ç derinliğine bağlı olarak 0,5 GiB/s ile 1,4 GiB/s arasında değişir ve daha yüksek G/Ç derinliklerinde 1,4 GiB/s'ye ulaşır.
Karşılaştırıldığında, Solidigm P5336, 128K ve 1M blok boyutlarında daha iyi performans gösterir ve 3,2 GiB/s'ye ulaşır. Daha küçük blok boyutları (16K) için, Solidigm P5336 da daha yüksek performans gösterir ve 16 ila 64 G/Ç derinliklerinde 1,4 GiB/s'lik bir tepe noktasına ulaşır. Bu, Solidigm P5336'nın yazma işlemleri sırasında daha küçük blok boyutlarıyla biraz daha verimli olduğunu göstermektedir.
Fark görünümüne geçtiğimizde, Dapustor J5060 ile Solidigm P5336'nın yazma performansı arasında daha büyük bir boşluk açıldığını görüyoruz. Verim karşılaştırmamız, J5060'ın çoğu alanda, özellikle tüm G/Ç derinliklerindeki büyük blok boyutlarında (1M) P5336'nın gerisinde kaldığını göstermektedir. Verim düşüşleri 4 G/Ç derinliklerinde -0,5 GiB/s'ye ulaşır. 128K blok boyutlarında daha yüksek G/Ç derinliklerinde performans artışları olsa da, genel yetersiz performansı telafi etmek için yeterli değildir.
Dapustor J5060 ve Solidigm P5336 arasındaki sıralı yazma gecikmesini karşılaştırırken, her iki sürücü de 16K gibi daha küçük blok boyutlarında benzer davranışlar sergiler; Solidigm düşük G/Ç derinliklerinde hafif bir avantaja sahipken, Dapustor daha yüksek derinliklerde (64 ve 128) farkı kapatır. 128K blok boyutlarında, Solidigm sığ kuyruk derinliklerinde yine liderdir, ancak Dapustor G/Ç derinliği arttıkça tutarlı olarak daha düşük gecikme süresi sağlar, bu da yük altında daha iyi ölçeklenmeyi gösterir. Ancak, 1M blok boyutlarında, Solidigm tüm G/Ç derinliklerinde net bir gecikme avantajını korur ve ağır sıralı yazma iş yükleri altında önemli ölçüde daha hızlı yanıt süreleri gösterir. Genel olarak, Solidigm daha tutarlı performans gösterirken, Dapustor'un gücü orta boyutlu bloklarda ve daha derin kuyruklarda daha belirgindir.
FIO İş Yükü Özeti
Flexible I/O Tester (FIO), depolama aygıtlarının çok çeşitli iş yükü senaryoları altında performansını ölçmek için kullanılan endüstri standardı bir kıyaslama aracıdır. Çok yönlülüğü ve güvenilirliği ile güvenilen FIO, gerçek dünya koşullarını simüle ederek bir SSD'nin yetenekleri ve performans sınırları hakkında bilgiler sağlar. StorageReview, iş yükü desenleri, blok boyutları ve kuyruk derinlikleri boyunca verim, gecikme ve IOPS'yi ölçerek kapsamlı analizler sunmak için FIO'dan yararlanır.
Uygulanan iş yükleri:
- 128K Sıralı Okuma ve Yazma
- 64K Rastgele Okuma ve Yazma
- 16K Rastgele Okuma ve Yazma
- 4K Rastgele Okuma ve Yazma
Bu iş yükleri, büyük sıralı aktarımlar, veritabanlarının tipik yoğun rastgele G/Ç ve sanallaştırılmış ortamlarda yaygın olarak görülen küçük blok rastgele erişimleri dahil olmak üzere geniş bir kurumsal kullanım alanı yelpazesini temsil eder.
Bu performans bölümü, Dapustor J5060'ın, değişen blok boyutları ve kuyruk derinliklerinde sıralı ve rastgele okuma/yazma işlemleri dahil olmak üzere temel sentetik iş yüklerindeki performansını özetlemektedir. Metrikler, doğrudan ayrıştırılmış fio çıktısından alınır ve hem verimi hem de yük altındaki kuyruk davranışını anlamak için bant genişliği (MB/s), IOPS ve %99,9999'a kadar gecikme süresi yüzdelerini içerir.
128K Sıralı Okuma ve Yazma Performansı
| Sürücü | İş Parçacığı/G/Ç Derinliği | BW (MB/s) | IOPS | 99,0% | 99,9% | 99,99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 Okuma | 1T/64Q | 7.482 | 57.081 | 1,66 ms | 2,02 ms | 2,83 ms |
| Solidigm P5336 Okuma | 1T/64Q | 7.479 | 57.057 | 1,51 ms | 1,66 ms | 1,81 ms |
| Dapustor J5060 Yazma | 1T/16Q | 3.023 | 23.063 | 0,69 ms | 0,69 ms | 0,70 ms |
| Solidigm P5336 Yazma | 1T/16Q | 3.364 | 25.669 | 2,67 ms | 3,48 ms | 4,42 ms |
Dapustor J5060, 128K'da etkileyici sıralı okuma performansı sunar, yüksek yüzdelerde bile sıkı gecikme kontrolü ile 7,48 GB/s'ye ulaşır. Solidigm P5336 ile karşılaştırıldığında, J5060'ın verimi temelde aynıdır (7,48 GB/s'ye karşı 7,47 GB/s). Ancak, Solidigm gecikme tutarlılığında hafif bir avantaja sahiptir ve marjinal olarak daha düşük kuyruk gecikmesi sergiler.
128K sıralı yazmalarda (QD16), J5060 çok düşük gecikme süresiyle 3.023 MB/s'lik sağlam bir performans elde eder. Ancak, Solidigm P5336 bu değeri orta düzeyde bir farkla aşarak 3.364 MB/s'ye ulaşır, ancak özellikle %99,99'luk yüzdede (4,42 ms'ye karşı Dapustor'un dikkat çekici derecede düşük 0,70 ms'si) daha yüksek bir gecikme süresiyle. Bu, J5060'ın gecikmeye duyarlı sıralı yazma senaryoları için daha güçlü bir aday olduğunu göstermektedir.
64K Rastgele Okuma ve Yazma Performansı
| Sürücü | G/Ç Derinliği | BW (MB/s) | IOPS | 99,0% | 99,9% | 99,99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 Okuma | 8T/32Q | 7.475 | 114.058 | 20,05 ms | 21,89 ms | 25,82 ms |
| Solidigm P5336 Okuma | 8T/32Q | 7.472 | 114.014 | 21,36 ms | 21,89 ms | 22,68 ms |
| Dapustor J5060 Yazma | 8T/32Q | 534 | 8.151 | 574,6 ms | 708,8 ms | 742,39 ms |
| Solidigm P5336 Yazma | 8T/32Q | 857 | 13.070 | 196,1 ms | 208,6 ms | 221,24 ms |
64K rastgele okumalarda (QD256), Dapustor J5060, 7,4 GB/s'ye yakın verim ve iyi kontrol edilen gecikme ile öne çıkar. Solidigm'in sonuçları yakından eşleşir (7,47 GB/s), biraz daha iyi maksimum yüzde gecikmesiyle. Her iki sürücü de burada olağanüstü performans gösterir, minimum pratik farklarla.
64K rastgele yazma performansı, J5060'ın belirgin şekilde zorlandığı yerdir; verim keskin bir şekilde 534 MB/s'ye düşer ve gecikme önemli ölçüde artar (%99,99'da 742,39 ms). Karşılaştırıldığında, Solidigm P5336, J5060'tan önemli ölçüde daha iyi performans göstererek 857 MB/s ve çok daha düşük gecikme süresi (aynı yüzdede 221,24 ms) sunar, bu da onu gecikmeye duyarlı uygulamalar ve sürekli yazma verimi için çok daha uygun hale getirir.
16K Rastgele Okuma ve Yazma Performansı
| Sürücü | G/Ç Derinliği | BW (MB/s) | IOPS | 99,0% | 99,9% | 99,99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 Okuma | 8T/32Q | 7.430 | 453.461 | 5,28 ms | 6,39 ms | 8,16 ms |
| Solidigm P5336 Okuma | 8T/32Q | 7.431 | 453.527 | 5,01 ms | 5,21 ms | 5,47 ms |
| Dapustor J5060 Yazma | 8T/32Q | 531 | 32.404 | 143,65 ms | 149,94 ms | 181,40 ms |
| Solidigm P5336 Yazma | 8T/32Q | 847 | 51.724 | 57,9 ms | 65,8 ms | 71,8 ms |
16K rastgele okuma iş yükünde (QD256), Dapustor 453K IOPS ve kontrollü gecikme ile mükemmel sonuçlar elde eder. Solidigm P5336 bu performansı esasen yansıtır, gecikmede Dapustor'u hafifçe geçer (99,99%'da 5,47 ms'ye karşı 8,16 ms), bu da yoğun rastgele okuma senaryolarında Solidigm için biraz daha iyi gecikme tutarlılığı olduğunu düşündürmektedir.
Dapustor SSD'nin 16K rastgele yazma performansı önemli ölçüde 32K IOPS'ye düşer ve gecikme 181,4 ms'ye (%99,99) yükselir. Burada yine, Solidigm Dapustor sürücüsünden önemli ölçüde daha iyi performans göstererek 51,7K IOPS ve dramatik şekilde iyileştirilmiş bir gecikme profili (99,99%'da 71,8 ms) sunar, bu da Solidigm'in gecikmeye duyarlı rastgele yazma iş yükleri için avantajını vurgular.
Pekin Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Küresel Strateji Direktörü
WhatsApp / WeChat: +86 13426366826
E-posta: yangyd@qianxingdata.com
Web sitesi: www.qianxingdata.com/www.storagesserver.com
İş Odak Noktası:
BT Ürün Dağıtımı/Sistem Entegrasyonu ve Hizmetleri/Altyapı Çözümleri
20 yılı aşkın BT dağıtım deneyimiyle, güvenilir ürünler ve profesyonel hizmetler sunmak için önde gelen küresel markalarla işbirliği yapıyoruz.
“Akıllı Bir Dünya İnşa Etmek İçin Teknoloji Kullanmak” Güvenilir BT Ürün Hizmet Sağlayıcınız!



