Önemli Önemli Noktalar
- Flash-first NVMe RAID:PERC13 H975i, tamamen SAS/SATA'dan uzaklaşıyor ve bir NVMe-native, AI hazır mimarisi için Broadcom SAS51xx üzerine inşa edilmiştir.
- Büyük nesil sıçraması:PCIe Gen5 x16, kontrolör başına 16'ya kadar NVMe sürücüsü ile (32 iki ile) testte kontrolör başına 52.5 GB / s ve 12.5M IOPS sağladı.+318% yazma bant genişliği, +31% 4K IOPS okuyor ve +466% 4K IOPS yazıyor.
- Yapay zeka sunucusu:Ön bütünleşik tasarım, GPU'lar için arka PCIe yuvalarını serbest bırakır, MCIO çalışmalarını kısaltır ve CPU üst maliyeti olmadan daha sabit, daha belirleyici bir işlem için hızlandırıcı başına özel bir depolama borusunu sağlar.
- Stres altında dayanıklılık:Süperkondansatör korumalı önbellek ve daha hızlı yeniden oluşturma süreleri, yeniden oluşturma sırasında yüksek performansı korurken (53.7 GB / s'ye kadar okur, 68 GB / s'ye kadar yazar, 17.3M / 5.33M 4K IOPS) 10 dakikaya kadar azaltır.
- Sonundan sonuna kadar güvenlik:Donanım Güven Kökü, SPDM cihaz kimliği ve sürücüleri, uçuş içi verileri ve denetleyici önbelleğini kapsayan tam spektrumlu şifreleme.
Dell PERC12 H965i ve PERC13 H975i Özellikleri
| Özellik | PERC12 H965i Ön | PERC13 H975i Ön |
|---|---|---|
| RAID seviyeleri | 0, 1, 5, 6, 10, 50, 60 | 0, 1, 5, 6, 10, 50, 60 |
| RAID olmayan (JBOD) | - Evet. | - Evet. |
| Ana otobüs türü | PCIe Gen4 x16 | PCIe Gen5 x16 |
| Yan bant yönetimi | I2C, PCIe VDM | I2C, PCIe VDM |
| Liman başına kapalı alanlar | Uygulanabilir değil | Uygulanabilir değil |
| İşlemci / Çip seti | Broadcom RAID-on-Chip, SAS4116W | Broadcom RAID-on-Chip, SAS5132W |
| Enerji Paketi / Yedek Güç | Akü | Süper kondansatör |
| Yerel Anahtar Yönetimi Güvenliği | - Evet. | - Evet. |
| Güvenli Kurumsal Anahtar Yöneticisi | - Evet. | - Evet. |
| Denetleyici kuyruğu derinliği | 8,192 | 8,192 |
| Değişken olmayan önbellek | - Evet. | - Evet. |
| Önbellek belleği | 8 GB DDR4 3200 MT/s | Entegre RAID önbelleği |
| Önbellek fonksiyonları | Geri yazmak, ileri okumak, geri yazmak, her zaman geri yazmak, ileri okumak yok | Geri yazmak, geri yazmak, her zaman geri yazmak, önceden okumak yok |
| Max Complex Sanal Diskler | 64 | 16 |
| Max Simple Sanal Diskler | 240 | 64 |
| Maksimum Disk Grupları | 64 | 32 |
| Disk grubu başına maksimum VD | 16 | 8 |
| Max Sıcak yedek cihazlar | 64 | 8 |
| Sıcak değişim cihazları desteklenir | - Evet. | - Evet. |
| Otomatik Yapılandırma (Öncelik ve Bir kez Çalıştır) | - Evet. | - Evet. |
| Donanım XOR Motoru | - Evet. | - Evet. |
| Çevrimiçi Kapasite Genişletme | - Evet. | - Evet. |
| Dedicated & Global Hot Spare | - Evet. | - Evet. |
| Desteklenen sürücü türleri | NVMe Gen3 ve Gen4 | NVMe Gen3, Gen4 ve Gen5 |
| VD Şerit Elementi Boyutu | 64KB | 64KB |
| NVMe PCIe Desteği | Gen4 | Gen5 |
| Yapılandırma Max NVMe Sürücüler | Kontrolör başına 8 sürücü | Kontrolör başına 16 sürücü |
| Desteklenen Sektör Büyüklükleri | 512B, 512e, 4Kn | 512B, 512e, 4Kn |
| Depolama Başlatma Desteği | Sadece UEFI | Sadece UEFI |
Dell PowerEdge sunucularındaki PERC13 H975i Ön denetleyici, sistem mimarisine sorunsuz bir entegrasyon için tasarlanmıştır.H975i doğrudan ön sürücü arka planına bağlanır ve özel PCIe 5 aracılığıyla ana tahtadaki ön MCIO konektörleriyle bağlantı kurar.0 arayüzleri. Bu entegre tasarım, kabloların uzunluğunu önemli ölçüde azaltırken, yüksek performanslı GPU'lar ve ek PCIe genişlemesi için arka PCIe yuvalarını korur.Bu sinyal bütünlüğünü korumaya yardımcı olur.Sonuç daha temiz bir iç düzen ve yoğun, hesaplama yoğun dağıtımlar için iyileştirilmiş hava akışı.
H975i, silikon seviyesindeki donanım onayından, SED sürücüleriyle yer alan tam spektrumlu veri şifrelemesine kadar uzanan kapsamlı bir güvenlik mimarisi uyguluyor.,Hardware Root of Trust, her bir firmware bileşeni üzerinden, iç önyükleme ROM'undan değişmez bir şifreleme doğrulama zinciri oluşturur.Sadece Dell sertifikalı doğrulanmış yazılımların denetleyici üzerinde çalıştırılabilmesini sağlamakBu donanım tabanlı güvenlik, Güvenlik Protokolü ve Veri Modeli (SPDM) uygulaması ile uzanır.her denetleyicinin, iDRAC'in gerçek zamanlı kimlik doğrulama işlemini gerçekleştirmesini sağlayan benzersiz bir Cihaz Kimliği Sertifikası içerdiği durumlardaKontrolör, geleneksel veri dinlenme senaryolarının ötesinde şifreleme korumasını, önbelleğe dahil eder.O yetkisiz firmware erişilemez güvenli bellek bölgelerinde şifreleme anahtarları korurSonuç olarak, hassas veriler sürücülerde veya aktif olarak önbellekte işlenirken korunmaktadır.
H975i'deki güç koruması, bir süper kondansatörün entegre edilmesiyle geleneksel pil destekli sistemlerden başka bir önemli evrimdir.Süper kondansatör beklenmedik güç kaybı olayları sırasında anlık güç dağıtımı sağlarAyrıca, öğrenme döngüleri için 4-8 saat gerektiren pil tabanlı sistemlerin aksine,H975i ̇s süper kondensatörü, kalibrasyon sırasında herhangi bir performans bozulması olmadan 5-10 dakika içinde Şeffaf Öğrenme Döngüsünü tamamlar.Bu tasarım, görev kritik veri koruması için üstün güvenilirlik sağlayarak, pil çözümlerine özgü bakım ve bozulma endişelerini ortadan kaldırır.
Entegre İzleme ve Yönetim
Dell'in PERC13 RAID denetleyicisi, Dell'in birçok RAID çözümü gibi, BIOS'taki Sistem Kurulumu aracılığıyla platform başlatma sırasında, iDRAC web GUI aracılığıyla,PERC12 kullanımı, ve hatta Dell OpenManage UI ve CLI.
iDRAC denetleyici yönetimi
iDRAC yönetim arayüzünü görüntülerken, denetleyiciler sekmesi sunucunun depolama donanımının genel bir görünümünü sunar.Firmware sürümleri hakkında bilgi ile birlikteBu özet, BIOS'a erişmek veya CLI araçlarını kullanmak zorunda kalmadan denetleyicilerin hazırlığını ve yapılandırmasını hızlı bir şekilde doğrulamanızı sağlar.
iDRAC'deki Sanal Diskler sekmesi, oluşturulan depolama dizinlerini, RAID seviyesini, boyutunu ve önbelleğe alma politikasını içerir.Bu bakış açısından, yöneticiler ciltlerin çevrimiçi olduğunu doğrulayabilir, yeni sanal diskler oluşturabilir veya mevcut yapılandırmaları ayarlamak veya silmek için Eylemler menüsünü kullanabilir.
RAID Denetleyicisi Yapılandırma Uygulaması
Yukarıdaki resim, PERC H975i Ön Yapılandırma Uygulama Sistem Kurulumunu PowerEdge R7715 platformunda girmenin bir örneğini göstermektedir.Tüm anahtar RAID denetleyici ayarlarını yönetebilirsiniz, Konfigurasyon Yönetimi, Denetleyici Yönetimi, Cihaz Yönetimi ve daha fazlası dahil.Bu araç, sanal diskleri kurmak ve donanım bileşenlerini doğrudan platform başlatma süreci sırasında izlemek için kolaylaştırılmış bir yol sağlar.
RAID seviyesini seçtikten sonra, dizi için fiziksel diskleri seçmeye devam ederiz. Bu örnekte, mevcut tüm NVMe SSD'ler listelenmiş ve RAID yetenekli olarak işaretlenmiştir. Çoklu 3'ü seçeriz.2 TiB Dell DC NVMe sürücüleri yapılandırılmamış kapasite havuzundan. Medya türü, arabirim ve mantıksal sektör boyutu gibi filtreler seçimi daraltmaya yardımcı olur.Disk seçimini tamamlamak ve Sanal Disk'i oluşturmaya devam etmek için "OK" tuşuna basarak devam edebiliriz..
Sanal disk oluşturmayı tamamlamadan önce, sistem seçilen fiziksel disklerdeki tüm verilerin kalıcı olarak silineceğini doğrulayan bir uyarı görüntüler.İşlemi onaylamak için Confirm kutusunu işaretleyip Yes'i seçeriz.Bu koruma, RAID oluşturma sürecinde kazara veri kaybını önlemeye yardımcı olur.
Sanal disk oluşturulduktan sonra, bu menüde görünür. Bu örnekte, yeni RAID 5 sanal diskinin kapasitesi 43.656 TiB ve durumu hazır.Sadece birkaç basit adımla, depolama yapılandırılmış ve kullanıma hazır.
PERC BIOS Yapılandırma Uygulaması ve iDRAC arayüzü yerel ve uzaktan yönetim için sezgisel seçenekler sunarken, Dell ayrıca PERC CLI (perccli2) adı verilen güçlü bir komut satırı aracı da sunar.Bu program Windows'u destekler, Linux ve VMware, bu nedenle başsız ortamlarda PERC denetleyicilerini yazma, otomasyon veya yönetme için idealdir.Dell ayrıca destek sitelerinde PERC CLI için kurulum ve komut kullanımı hakkında ayrıntılı belgeleri sağlar.
Dell PERC13 Performans Testleri
Performans testine dalmadan önce, çevreyi, çift PERC H975i ön denetleyiciyle yapılandırılmış Dell PowerEdge R7715 platformunu kullanarak hazırladık.2TB Dell NVMe sürücüleri, her biri 12.000 MB/s sıralı okuma ve 5.500 MB/s sıralı yazma için 128 KiB blok boyutlarını kullanır.Bu yüksek performanslı temel PERC13 denetleyici'nin verimliliğinin sınırlarını zorlamamızı ve RAID davranışını ölçekte değerlendirmemizi sağlar..
- Platform:Dell PowerEdge R7715
- CPU:AMD EPYC 9655P 96 çekirdekli işlemci
- Ram:768GB (12 x 64GB) DDR5-5200 ECC
- Saldırı Kontrolörü:2 x PERC13 H975i
- Depolama:32 x 3.2TB Dell CD8P NVMe sürücüleri
- PCIe hızlandırıcıları:2 x NVIDIA H100 GPU
NVIDIA Magnum IO GPU Doğrudan Depolama: AI Depolama ile Buluşuyor
Modern yapay zeka boru hatları genellikle hesaplamalara bağlı değil, I / O bağlıdır. Veri grupları, gömülmeler ve kontrol noktaları, hızlandırıcıları meşgul tutmak için depolamadan GPU belleğine yeterince hızlı bir şekilde aktarılmalıdır.NVIDIA'nın Magnum IO GDS'si (cuFile üzerinden) geleneksel SSD → CPU DRAM → GPU yolunu kısa devreye sokar ve verileri DMA'ya doğrudan NVMe'den GPU belleğine gönderirBu işlemci çıkış tamponu masraflarını azaltır, gecikmeyi azaltır ve yük altında verimi daha öngörülebilir hale getirir.ve daha hızlı kontrol noktası kurtarma/yükleme döngüleri.
GDSIO testimiz, depolama-GPU veri yolunun kendisini ölçmek, PERC13 destekli NVMe setinin H100 belleğine ne kadar hızlı akış yapabileceğini göstermek için blok boyutlarını ve iplik sayısını süpürmek için tasarlanmıştır.PCIe 5'teki her H975i ile.0 x16 bağlantı (teorik olarak kontrolör başına ~ 64 GB / s, tek yönlü), iki kontrolör toplam bir tavanı ~ 112 GB / s yakınında belirler; burada eğri plato'umuz bağlantı veya medya sınırlı olup olmadığınızı size söyler.Uzmanlar için, grafikleri gerçek iş yükleri için vekil olarak okuyor: veri kümesi akışına büyük sıralı harita okuyor ve kontrol noktası geri yükler; kontrol noktasına büyük sıralı harita yazıyor kaydeder;Eşzamanlı olarak daha küçük transferler veri yükleyici karıştırmalarını yansıtır ve önceden alınırKısacası, güçlü GDSIO ölçeklendirme, daha az GPU standı ve hem eğitim hem de yüksek verimli çıkarım sırasında daha tutarlı performans anlamına gelir.
GDSIO Sequencial Read Throughput
Sıralı okuma ile başlayarak, işlem düşük blok boyutlarında ve iplik sayılarında mütevazı bir şekilde başladı ve tek bir iplik ile 8K bloklarda 0.3 GiB / s civarında başladı.Performans 16K ve 512K bloklar arasında keskin bir şekilde ölçeklendiÖzellikle iplik sayısını 4'ten 16'ya yükseltirken, en önemli kazanımlar, 1M, 5M ve 10M blok boyutlarında meydana geldi.10M blok boyutunda 256 iplik ile 103 GiB/s'de zirveBu ilerleme, PERC13 dizininin daha büyük blok boyutlarından ve çoklu iplik paralelliğinden yararlandığını, 64-128 iplik etrafında optimum doymakla, bunun ötesinde plato kazanır.
GDSIO Sequencial Throughput Diferansiyelini Oku
8K'dan 10M'ye kadar blok boyutlarında sıralı okuma testlerinde, PERC13 (H975i) PERC12'yi (H965i) sürekli olarak geride bıraktı.Daha büyük blok boyutlarında ve daha yüksek iplik sayısında yüzde kazançları çarpıcı bir şekilde ölçeklendirilir.
Daha küçük blok boyutlarında (8K-16K), iyileşmeler mütevazıydı (genellikle 0-20% arasında değişir) ve bazı izole durumlarda H975i, düşük kuyruğa derinliklerde test değişkenliği nedeniyle hafif bir şekilde geride kaldı.32K-64K blok boyutlarına göre, avantaj daha tutarlı hale geldi, H975i, çoğu iplik sayısında %30-50 daha fazla işlem sağladı.
En belirgin farklılıklar, PERC13 denetleyicisinin sistemin tam sıralı okuma potansiyelini kilitlediği daha büyük blok boyutlarında (128K ila 10M) gözlemlendi.H975i, H965i'ye kıyasla 50-120% artış gösterdi.Örneğin, 8-16 iplikten oluşan 1M blok boyutunda, aktarım hızı 55 GiB/s'den fazlaydı, bu da yaklaşık% 90'lık bir yüklenme ile eşdeğerdi.Bazı konfigürasyonlar önceki nesil ile karşılaştırıldığında neredeyse iki kat daha fazla performans gösteriyor.
Genel olarak, PERC13 (H975i), özellikle blok boyutu ve iplik sayısının ölçeklendirilmesi nedeniyle, sıralı okuma iş yüklerinde önderlik etti.256K ve üstü, daha yeni denetleyici, Dell'in en son RAID platformundaki mimari gelişmeleri açıkça vurgulayan, sürekli olarak %50-100+ daha yüksek performans sağladı.
GDSIO Sequencial Latency okuyor
Sıralı okuma oranı arttıkça, gecikme daha küçük blok boyutlarında ve daha düşük iplik sayılarında yönetilebilir kaldı.Bu aralıkta okumaları verimli bir şekilde işleyenBlok boyutları ve iplik sayıları, özellikle 5M ve 10M'de 64 veya daha fazla iplik ile daha yüksek ölçeklendikten sonra gecikme hızla yükseldi ve 256 iplik ile 10M blok boyutunda 211.8 ms'ye ulaştı.Bu, aşırı iş yükleri altında denetleyici veya kuyruğu sıkıntılarının nasıl ortaya çıktığını vurgular., her ne kadar verimlilik yüksek kalsa da.
Performans ve verimliliğin en iyi dengesi, dizinin geçiş süresini 179-334 μs arasında tutarken 87.5-93.7 GiB / s verimliliğini sürdürdüğü 8-16 iplik ile 1M blok boyutunda gözlemlendi.Bu bölge, bir milisaniyenin altında gecikmeleri korurken bant genişliğini en üst düzeye çıkarmak için tatlı noktayı temsil eder..
GDSIO Sequencial Throughput Yazmak
Yazma performansı, blok boyutlarının artmasıyla birlikte güçlü erken ölçeklendirme gösterdi ve işlem hızı 8K'da 1.2 GiB/s'den 256K'da 1 thread'den 13.9 GiB/s'ye yükseldi.En önemli büyüme 128K ve 1M blok boyutları arasında ortaya çıktı, 8 ila 16 iplik üzerinde 80 GiB/s'nin üzerinde bir işlem hızına ulaştı. En yüksek performans, 8 iplikten itibaren 100 ila 101 GiB/s'yi sürdüren 5M ve 10M blok boyutlarında geldi.
Performans, bu daha büyük bloklar için 8 ile 64 iplik arasında düzleştirildi, bu da denetleyicilerin ölçeklendirme eğrisinin erken dönemlerinde doyum sağladığını göstermektedir.,Değişen verim istikrarı, büyük 5M ve 10M bloklarında 101 GiB/s'de sabit kalırken, 256K gibi orta aralık blok boyutlarında ise 61.2 GiB/s'den 32 dize 45'e düşer.3 GiB/s 256 iplikten.
GDSIO Yazım Sıralı Aktarım Differansiyeli
PERC13 (H975i), PERC12 (H965i) üzerinde önemli kazançlar sağladı. Özellikle blok boyutları ve iplik sayıları ölçeklendirildiğinde.Gelişmeler mütevazıydı.Genellikle %0-10 arasında, ara sıra test gürültüsü önemsiz farklılıklar göstermektedir.
64K'dan itibaren, H975i'nin avantajı daha belirgin hale geldi. 64K blok boyutunda, gelişmeler H965i'ye kıyasla 12-17 GiB/s'den fazla artarak %40-70'e ulaştı. 128K-256K'da,H975i sürekli olarak orta ila yüksek iplik sayısında 50-70% daha yüksek verimlilik sağladı.
En çarpıcı performans boşluğu daha büyük blok boyutlarında (512K ile 10M arasında) ortaya çıktı. 512K'da, H975i, H965i'ye göre %60-80'lik bir iyileşme ile eşdeğer olan +31 ila +56 GiB/s kazanç elde etti.1M blok boyutundaSon olarak, 5M ve 10M blok boyutlarında PERC 13, PERC 12'ye kıyasla neredeyse iki kat daha fazla işlem gerçekleştirdi.+75 ila +79 GiB/s deltaları ile, bazı iplik açısından zengin senaryolarda %100'lük bir iyileşme anlamına geliyor.
Genel olarak, PERC 13 denetleyicisi, sıralı yazma performansında net bir nesil sıçraması gösterdi.H975i sürekli olarak %50-100 daha yüksek verimlilik sağlar., yazma yoğunluklu sıralı iş yüklerinde H965i'ye karşı üstünlüğünü sağlam bir şekilde ortaya koyuyor.
GDSIO Sıralı Gecikme Yaz
Sıralı yazma sırasında gecikme, daha küçük blok boyutlarında ve daha düşük iplik sayılarında etkileyici derecede düşük kaldı, genellikle 8 iplik kadar olan 128K bloklar arasında 50 μs'den az kaldı.İpek sayıları arttıkça, gecikme daha belirgin bir şekilde ölçeklendi. Örneğin, gecikme, 32 dize ile 512K'da 392 μs'ye ulaştı ve 64 dize ile 1M blok boyutunda 1 ms'yi aştı.
Doymak etkileri, en büyük blok boyutlarında ve en yüksek eşzamanlılık seviyelerinde daha belirgin hale geldi. Gecikme, 5M'de 128 dize ile 12.4 ms'e yükseldi ve 256 dize ile 10M'de 50.3 ms'e ulaştı.
Sıralı yazma iş yükleri için en verimli işletim noktası, 8 ila 16 ögesine sahip 1M veya 5M blok boyutlarında meydana geldi.2 GiB/s iken gecikme 178 μs içinde kaldı.7 ms, aşırı yazma kuyruğu gecikmeleri tetiklemeden güçlü sürdürülebilir performans sağlar.
MLPerf Depolama 2.0 Performansı
AI eğitim ortamlarında gerçek dünya performansını değerlendirmek için MLPerf Storage 2.0 test paketi kullandık.Simüle edilmiş derin öğrenme iş yükleriDepolama sistemlerinin kontrol noktası ve model eğitimi gibi zorlukları nasıl ele aldığına dair anlayış sağlar.
Kontrol Noktası Benchmark
Makine öğrenimi modellerini eğitirken, kontrol noktaları, modelin durumunu periyodik olarak kaydetmek için gereklidir.Eğitim sırasında erken durmayı sağlar, ve araştırmacıların deneyler ve ablasyonlar için çeşitli kontrol noktalarından dallaşmasına izin verir.
Kontrol noktası kaydetme süresi karşılaştırması, Dell PERC13'ün tüm model konfigürasyonlarında PERC12'yi sürekli olarak geride bıraktığını ortaya çıkardı. PERC 13, 7.61 ila 10.17 saniye arasında kaydetme süreleri elde etti.PERC12' nin 10' a ihtiyacı varkenAynı işlemler için.41 ila 20.67 saniye arasında performans farkı 1T parametre modeli ile en belirgindi.PERC13'ün tamamladığı kaydetme süreci PERC12'nin 20+ saniyesine kıyasla 10 saniyeden biraz daha fazlaBu, en büyük modeller için tasarruf zamanında yaklaşık %50'lik bir azalma anlamına gelir.
Kaydetme işlem sonuçlarını inceleyerek, veriler PERC13'ün üstün bant genişliği kullanımını sergiliyor ve sürekli olarak daha yüksek veri aktarım oranları sunuyor. PERC13 11.46 ile 14. arasında işlem hızına ulaştı.81 GB/s1T modelinde en yüksek performansı olan PERC12 ise en büyük konfigürasyon için 9.49 GB/s'ye düşer ve 6.98 GB/s'ye düşer.Yeni denetleyici farklı model boyutlarında daha istikrarlı bir performans sağlar, kontrol noktası işlemleri için tipik olan büyük sıralı yazıları işlemek için daha iyi bir optimizasyon önermektedir.
Pekin Qianxing Jietong Technology Co., Ltd.
Sandy Yang, Küresel Strateji Direktörü
WhatsApp / WeChat: +86 13426366826
E-posta: yangyd@qianxingdata.com
Site: www.qianxingdata.com/www.storagesserver.com
İş odaklı:
İKT Ürün dağıtım/Sistem entegrasyonu ve hizmetler/altyapı çözümleri
20+ yıllık BT dağıtım deneyimiyle, güvenilir ürünler ve profesyonel hizmetler sunmak için önde gelen küresel markalarla ortaklık kuruyoruz.
Akıllı bir dünya inşa etmek için teknolojiyi kullanmak güvenilir İKT ürün hizmet sağlayıcınız!



