AMD, mevcut veri merkezi altyapılarında revizyona gerek kalmadan şirket içi yapay zeka çıkarımı arayan kurumsal kullanıcılar için özel olarak tasarlanmış yeni bir PCIe hızlandırıcı olan Instinct MI350P'yi resmi olarak piyasaya sürdü. Çift yuvalı, tam yükseklikte ve tam uzunlukta form faktörüne sahip bu grafik kartı, geleneksel hava soğutmalı sunucularla tamamen uyumludur. Bu aynı zamanda AMD'nin yaklaşık dört yıldır standart sunucu yuvaları için tasarlanmış yeni nesil Instinct çipini ilk kez piyasaya sürmesini de işaret ediyor.
AMD Instinct MI350P
AMD'nin PCIe tabanlı Instinct ürün serisi, 2022'nin başlarında MI210'un piyasaya sürülmesinden sonra durgun kaldı. MI300X, MI325X ve OAM formatlı MI350X de dahil olmak üzere sonraki tüm nesiller, özel evrensel süpürgeliklere monte edilen OAM soketli modülleri benimsedi. Bu modüller, tek bir tepside sekiz adede kadar 1.000 W sınıfı hızlandırıcıyı desteklemek için sağlam güç dağıtımı ve hava akışına sahip özelleştirilmiş muhafazalar gerektirir. Bu tür donanım mimarisi, GPU raflarını toplu olarak satın alan hiper ölçekli bulut sağlayıcılarına uygundur, ancak yerinde çıkarım görevleri için ısmarlama AI raflarını dağıtmak istemeyen veya kullanamayan sıradan işletmelere uyum sağlamakta başarısız olur. MI350P tam olarak bu pazar boşluğunu dolduruyor. Şu anda NVIDIA'nın bu segmentte üst düzey sunucu sınıfı bir PCIe rakibi bulunmaması, AMD'ye geçici pazar ayrıcalığı bırakıyor.
Donanım Karşılaştırması: MI350P ve MI350X OAM
MI350P, MI350X'in kısaltılmış bir versiyonu değildir; AMD, bu yeni model için bağımsız, modern bir çip tasarladı. MI350X, sekiz hızlandırıcı karmaşık kalıp (XCD) ile eşleştirilmiş iki G/Ç kalıbını entegre ederek toplamda 256 hesaplama birimi sağlar. Buna karşılık MI350P, bir G/Ç kalıbı ve dört XCD içerir; bu da 128 hesaplama birimine karşılık gelir. Silikon ölçeğinin yarıya indirilmesine rağmen, daha üst seviye muadili ile aynı 2,2 GHz tepe saat frekansını korur. Bellek yapılandırması aynı indirgenmiş spesifikasyonu takip ediyor: MI350X'in 288 GB ve 8 TB/s veri çıkışıyla karşılaştırıldığında dört HBM3E yığını (sekize karşı), 4.096 bit bellek veri yolu (8.192 bitten aşağı), 144 GB bellek kapasitesi ve 4 TB/s bant genişliği.
AMD Instinct MI350P mimarisi
En yüksek bilgi işlem verimi de yarı yarıya azalır. MI350P, MI350X'in 9,2 PFLOPS'una kıyasla 4,600 MXFP4 TFLOPS'a, premium modelin 4,6 PFLOPS'una kıyasla 2,300 FP8 TFLOPS'a ulaşır. BF16, FP16 ve diğer hassas standartlara ilişkin performans ölçümleri de aynı orantılı düşüşü takip ediyor. AMD'nin şeffaflık adına hem en yüksek hem de gerçek dünyadaki sürekli performans verilerini yayınlaması dikkate değer. Kart, MXFP4 altında 2.299 TFLOPS, FP8 altında 1.529 TFLOPS ve BF16 altında 713 TFLOPS sunar. Bu pratik rakamlar, güç kısıtlamalarının ve bellek bant genişliği sınırlamalarının kaçınılmaz olarak teorik en yüksek performansı düşürdüğü 600 W'lık bir güç aralığındaki gerçek çıkışı yansıtır.
Editör ekibi daha önce MI350X platformunu Supermicro'nun Jumpstart programı aracılığıyla değerlendirdi ve sağlam çıkarım iş yükü yeteneklerini fark etti. Ekip, bu PCIe form faktörlü hızlandırıcının standart ticari sunucu kasası içinde nasıl performans gösterdiğini analiz ederek MI350P'yi uygulamalı olarak test etmeye istekli.
MI350P, yarıya indirilmiş silikon ölçeğine rağmen %50'lik bir güç azaltma özelliğine sahip değildir. MI350X'in 1000W sınırının kabaca %60'ına eşdeğer olan 600W TBP güç derecesine sahiptir. Bu en yüksek watt, PCIe CEM spesifikasyonunun üst sınırına ulaşarak kartı yuvanın maksimum termal eşiğinde çalıştırır. Yetersiz soğutmaya sahip sunucular için orta düzeyde performans kesintilerinin eşlik ettiği azaltılmış 450 W çalışma modu mevcuttur. Aynı güç grubunda yer alan MI350P, kurumsal satın alma alanında NVIDIA'nın H200 NVL ve RTX Pro 6000 Sunucusu ile doğrudan rekabet eder.
NVL4 yüksek hızlı ara bağlantılara sahip NVIDIA H200'ün aksine MI350P, Infinity Fabric pozlamasını devre dışı bırakır. Tüm GPU'lar arası veri iletimi, PCIe Gen5 x16'nın 128 GB/sn bant genişliği ile sınırlıdır.
Sekiz GPU'lu Hava Soğutmalı Dağıtım
Standart bir çift yuvalı FHFL PCIe kartı olan MI350P, mevcut kurumsal sunucularla uyumludur. Büyük OEM'ler, daha önce incelenen Dell PowerEdge XE7740 ve HPE ProLiant DL380a Gen12 dahil olmak üzere yoğun sekiz GPU'lu hava soğutmalı modeller sunmaktadır. 600W hızlandırıcılar için optimize edilen bu platformlar, özel raflara, sıvı soğutmaya veya OAM süpürgeliklere ihtiyaç duymaz.
Sekiz kartlı MI350P yapılandırması, 1.152 GB HBM3E ve 32 TB/s toplam bant genişliği sunar; bu, hava soğutmalı bir kasada trilyon parametreli modelleri MXFP4 hassasiyetinde barındırmaya yeterlidir. Bununla birlikte, özel ölçeklendirme kumaşlarından fedakarlık eder. MI350X hızlı modüller arası iletişim için Infinity Fabric'i kullanırken MI350P yalnızca PCIe Gen5'e dayanır. Bu mimari, çıkarım için düğüm-yerel tensör paralelliğine ve düğümler arası veri paralelliğine uygundur; oysa OAM tabanlı MI350X, bant genişliği yoğun yapay zeka eğitim görevleri için üstün olmaya devam ediyor.
Hassas Formatlar
MI350P, MI350X'in tüm hassas formatlarını yükseltme gerektirmeden devralır. MXFP4, MXFP6 ve MXFP8 dahil OCP blok ölçeklendirme türleri, AI model geliştirmede ana akım haline geldi ve göz ardı edilebilir kalite kaybıyla düşük hassasiyetli eğitime olanak sağladı. MXFP4, FP8'in iki katından fazla hız ve BF16'nın dört katı verim sağlar. OpenAI gpt-oss ve Kimi K2.6 gibi gerçek dünya vakaları, yerel düşük bit nicelemenin değerini kanıtlıyor. MXFP4 ve INT4 ağırlıkları BF16 bellek alanının yalnızca %25'ini kapladığından, trilyon parametreli modeller sekiz GPU'lu tek bir sunucuya yerleştirilebilir ve şirket içi kuruluşlar için hantal çok düğümlü kümeleri ortadan kaldırır.
Sonuç olarak
Şirket içi yapay zeka kuruluşlarının çoğu, ham bilgi işlem yeteneğinden ziyade güç, soğutma, yoğunluk ve bütçeyle kısıtlanıyor. Kolayca takılan MI350P, bu dağıtım engellerini etkili bir şekilde hafifletir. NVIDIA'nın bu segmentte amiral gemisi PCIe sunucu GPU'suna sahip olmaması nedeniyle AMD, şimdilik açık bir rekabet avantajını koruyor. Daha fazla ayrıntıyı AMD'nin resmi Instinct web sayfasında bulabilirsiniz.
Pekin Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Küresel Strateji Direktörü
WhatsApp / WeChat: +86 13426366826
E-posta: yangyd@qianxingdata.com
Web sitesi: www.qianxingdata.com/www.storagesserver.com
İş Odağı:
BİT Ürün Dağıtımı/Sistem Entegrasyonu ve Hizmetleri/Altyapı Çözümleri
20 yılı aşkın BT dağıtım deneyimimizle, güvenilir ürünler ve profesyonel hizmetler sunmak için önde gelen küresel markalarla ortaklık yapıyoruz.
“Akıllı Bir Dünya İnşa Etmek İçin Teknolojiyi Kullanmak”Güvenilir BİT Ürün Servis Sağlayıcınız!
Sandy Yang/Küresel Strateji Direktörü
WhatsApp / WeChat: +86 13426366826
E-posta: yangyd@qianxingdata.com
Web sitesi: www.qianxingdata.com/www.storagesserver.com
İş Odağı:
BİT Ürün Dağıtımı/Sistem Entegrasyonu ve Hizmetleri/Altyapı Çözümleri
20 yılı aşkın BT dağıtım deneyimimizle, güvenilir ürünler ve profesyonel hizmetler sunmak için önde gelen küresel markalarla ortaklık yapıyoruz.
“Akıllı Bir Dünya İnşa Etmek İçin Teknolojiyi Kullanmak”Güvenilir BİT Ürün Servis Sağlayıcınız!



