logo
Ana sayfa Haberler

hakkında şirket haberleri Depolama Ölçeği KV Önbellek yönetimi konusunda Big Blue'nun Redbook'u

Sertifika
Çin Beijing Qianxing Jietong Technology Co., Ltd. Sertifikalar
Çin Beijing Qianxing Jietong Technology Co., Ltd. Sertifikalar
Müşteri yorumları
Beijing Qianxing Jietong Technology Co., Ltd'nin satış personeli çok profesyonel ve sabırlıdır. Hızlı bir şekilde teklif verebilirler. Ürünlerin kalitesi ve paketlemesi de çok iyi. İşbirliğimiz çok düzgün.

—— 《Festfing DV》LLC

Acilen intel CPU ve Toshiba SSD ararken, Pekin Qianxing Jietong Technology Co., Ltd'den Sandy bana çok yardım etti ve ihtiyacım olan ürünleri hızla aldı. Onu gerçekten takdir ediyorum.

—— kedi yavrusu

Beijing Qianxing Jietong Technology Co., Ltd'den Sandy, bir sunucu satın aldığımda bana yapılandırma hatalarını zamanında hatırlatabilen çok dikkatli bir satıcıdır. Mühendisler de oldukça profesyonel ve test sürecini hızla tamamlayabiliyorlar.

—— Strelkin Mihail Vladimiroviç

Beijing Qianxing Jietong ile çalışmaktan çok memnunuz. Ürün kalitesi mükemmel ve teslimat her zaman zamanında yapılıyor. Satış ekibi profesyonel, sabırlı ve tüm sorularımızda çok yardımcı oluyor. Destekleri için gerçekten minnettarız ve uzun vadeli bir ortaklık için sabırsızlanıyoruz. Şiddetle tavsiye edilir!

—— Ahmad Navid

MikroTik RB3011 zaten kullanılmıştı, ama çok iyi durumdaydı ve her şey mükemmel şekilde çalışıyor.Ve tüm endişelerim hızlıca ele alındı.- Çok güvenilir bir tedarikçi. - Çok tavsiye ederim.

—— Geran Colesio

Ben sohbet şimdi
şirket Haberler
Depolama Ölçeği KV Önbellek yönetimi konusunda Big Blue'nun Redbook'u

IBM Storage Scale paralel dosya sistemi, NVIDIA Dynamo ile eşleştirilen dağıtılmış KV önbelleği yönetimini destekler ve büyük bağlam iş yükleri ile büyük ölçekli AI çıkarım senaryolarına hizmet verir.

hakkında en son şirket haberleri Depolama Ölçeği KV Önbellek yönetimi konusunda Big Blue'nun Redbook'u  0

IBM, resmi bir Redbook yayınladı.Sınırsız Bağlantı: Büyük ölçekli yapay zeka çıkarımı için yüksek performanslı bir KV önbelleği platformu, bu ortak çözüm için tam bir doğrulanmış referans mimarisi sunar. Entegre yığın, Supermicro Petascale Depolama Sunucuları, NVIDIA Spectrum-X Ethernet ağını,ve IBM Storage Scale Erasure Coding Edition (ECE), AI çıkarımı için yüksek performanslı bir paylaşılan depolama katmanı oluşturmak içinIBM ITSO (Uluslararası Teknik Destek Örgütü) tarafından yayınlanan yetkili teknik belgeler olarak, IBM Redbooks, pratik,Kurumsal düzeyde IBM altyapı ürünleri için derinlemesine dağıtım rehberliği.

IBM, Supermicro ve NVIDIA'nın mühendislik ekiplerinin ortak yazarı olan Redbook, uzun bağlamlı yapay zeka iş yüklerinin temel bir ağrılı noktasını ele alıyor.RAG alım uygulamaları ve özerk ajan boru hatları, GPU HBM içinde büyük KV önbelleği verileri oluştururÖnbelleğe alınan veriler sınırlı HBM kaynaklarından çıkarıldıktan sonra, tekrarlanan yeniden hesaplamalar ciddi gecikme artışlarını tetikleyecek ve sürekli çapraz istek KV önbelleği depolamasını vazgeçilmez hale getirecektir.

Çözüm, farklı gecikme ve kapasite taleplerini kapsayan beş katmanlı hiyerarşik KV önbelleği mimarisini benimser:
  • G1 katmanı: GPU düğümü yerel HBM
  • G2 Katmanı: CPU düğüm sistemi DRAM
  • G3 katmanı: Doğrudan bağlı yerel SSD
  • G3.5 Katman: Pod düzeyinde paylaşılan flash depolama, NVIDIA BlueField DPU'ları ile doğrudan GPU sunucu DPU'larına bağlantı kuruluyor
  • G4 katman: Tüm GPU hesaplama sunucularına bağlı dış çapraz Ethernet paylaşılan depolama havuzu
Bu çok katmanlı yapılandırma, uçtan uca bellek ve depolama hiyerarşisini kapsar ve sürekli gecikme ve kapasite eğimi sağlar.Otomatik tahliye ve tüm depolama yığınındaki dinamik veri yeniden yükleme, esnek bir şekilde değişik iş yükü erişim kalıplarına ve toplam altyapı maliyeti bütçelerine uyarlanabilir.

Supermicro Petascale Depolama Sunucularında dağıtılan, Depolama Ölçeği ECE, G4 soğuk önbelleği katmanı olarak hizmet eder. Gecikme duyarlı olmayan KV önbelleği verileri için optimize edilmiştir.Aktif olmayan çok dönüşlü konuşma durumları da dahil, anında yanıt gerektirmeyen ortak ajan bağlamı verileri ve tarihsel sorgu kayıtları.

Redbook'da kaydedilen test sonuçlarına göre, bu üretim hazır referans mimarisi, üretken AI ve ajantik AI çıkarım hizmetlerini etkili bir şekilde hızlandırıyor.Tek istekli TTFT (Time To First Token) testlerinde, harici depolama ölçeği KV önbelleği olmayan bağımsız GPU sunucularıyla karşılaştırıldığında, entegre sistem, hızlı uzunluk değişikliklerine rağmen istikrarlı bir TTFT'yi korur.56 kat hızlandırma130k-token giriş dizisi altında ve genişletilmiş uyarı uzunluklarından kaynaklanan çıkarım gecikme dalgalanmalarını tamamen ortadan kaldırır.

Eşzamanlı çok kullanıcılı çıkarım basıncı altında, çözüm çarpıcı bir performans iyileştirmesi elde eder: istek işlem hızı 0,19 RPS'den 4,26 RPS'ye yükselerek,22 kat verim artışıBu arada, 200 çıkarım isteği için toplam işleme süresi% 95 oranında azalır, GPU kullanım verimliliğini ve genel çıkarım kümesi ölçeklenebilirliğini büyük ölçüde artırır.

Yığın, sert gürültülü komşu stres testlerinde de sağlam bir performansı korur. Dört müşteri ucu ile sürekli 200 GB / s rakip ağ I / O trafiği üretir.Entegre sistem hala 3'te istikrarlı çalışıyor..6 RPS, tüm 200 çıkarım isteğini 55.56 saniye içinde bitirir.18 kat daha yüksekSadece GPU'ya dayalı yeniden hesaplama mimarisi.

Araştırma ekibi Redbook'da şu sonuca varmıştır: "Güçlü GPU donanım yatırımları üzerine ROI'yi en üst düzeye çıkarmayı hedefleyen işletmeler için, bu doğrulanmış entegre mimari, basit,İfade verimliliğini artırmak için üretime hazır yaklaşım, uçtan uca gecikmeyi azaltmak, daha yüksek hizmet eşzamanlılığını desteklemek ve daha uygun maliyetli büyük ölçekli yapay zeka çıkarım altyapısı oluşturmak.

Anahtar kelimeler: SUPERMICRO, IBM Storage Scale, NVIDIA Dynamo

Pekin Qianxing Jietong Technology Co., Ltd.
Sandy Yang, Küresel Strateji Direktörü
WhatsApp / WeChat: +86 13426366826
E-posta: yangyd@qianxingdata.com
Site: www.qianxingdata.com/www.storagesserver.com
İş odaklı:
İKT Ürün dağıtım/Sistem entegrasyonu ve hizmetler/altyapı çözümleri
20+ yıllık BT dağıtım deneyimiyle, güvenilir ürünler ve profesyonel hizmetler sunmak için önde gelen küresel markalarla ortaklık kuruyoruz.
Akıllı bir dünya inşa etmek için teknolojiyi kullanmak güvenilir İKT ürün hizmet sağlayıcınız!
Pub Zaman : 2026-06-12 11:09:46 >> haber listesi
İletişim bilgileri
Beijing Qianxing Jietong Technology Co., Ltd.

İlgili kişi: Ms. Sandy Yang

Tel: 13426366826

Sorgunuzu doğrudan bize gönderin (0 / 3000)