logo
Ana sayfa Davalar

IBM, RAG İş Yükleri İçin İçerik Duyarlı Depolama Tanıttı

Sertifika
Çin Beijing Qianxing Jietong Technology Co., Ltd. Sertifikalar
Çin Beijing Qianxing Jietong Technology Co., Ltd. Sertifikalar
Müşteri yorumları
Beijing Qianxing Jietong Technology Co., Ltd'nin satış personeli çok profesyonel ve sabırlıdır. Hızlı bir şekilde teklif verebilirler. Ürünlerin kalitesi ve paketlemesi de çok iyi. İşbirliğimiz çok düzgün.

—— 《Festfing DV》LLC

Acilen intel CPU ve Toshiba SSD ararken, Pekin Qianxing Jietong Technology Co., Ltd'den Sandy bana çok yardım etti ve ihtiyacım olan ürünleri hızla aldı. Onu gerçekten takdir ediyorum.

—— kedi yavrusu

Beijing Qianxing Jietong Technology Co., Ltd'den Sandy, bir sunucu satın aldığımda bana yapılandırma hatalarını zamanında hatırlatabilen çok dikkatli bir satıcıdır. Mühendisler de oldukça profesyonel ve test sürecini hızla tamamlayabiliyorlar.

—— Strelkin Mihail Vladimiroviç

Beijing Qianxing Jietong ile çalışmaktan çok memnunuz. Ürün kalitesi mükemmel ve teslimat her zaman zamanında yapılıyor. Satış ekibi profesyonel, sabırlı ve tüm sorularımızda çok yardımcı oluyor. Destekleri için gerçekten minnettarız ve uzun vadeli bir ortaklık için sabırsızlanıyoruz. Şiddetle tavsiye edilir!

—— Ahmad Navid

MikroTik RB3011 zaten kullanılmıştı, ama çok iyi durumdaydı ve her şey mükemmel şekilde çalışıyor.Ve tüm endişelerim hızlıca ele alındı.- Çok güvenilir bir tedarikçi. - Çok tavsiye ederim.

—— Geran Colesio

Ben sohbet şimdi

IBM, RAG İş Yükleri İçin İçerik Duyarlı Depolama Tanıttı

April 24, 2026
IBM, depolama katmanının içine doğrudan AI veri işlemini yerleştiren bir içerik bilinçli depolama (CAS) mimarisi tanıttı.Bu yaklaşım, geri alım-artırılmış üretim (RAG) iş akışları için uyarlanmıştır., doküman vektörleşmesini depolama sisteminin içine entegre ettiği için, dış ön işleme boru hatlarına olan ihtiyacı azaltır.

CAS, büyük dil modeli (LLM) tabanlı yöntemler yoluyla önemli bir RAG fonksiyonunu depolama altyapısına aktarır.Bu, işletmelerin mevcut konumunda verileri işleme almasına ve indekslemesine izin verir., depolama sistemlerini Yapay Zeka ile yönetilen iş yükleriyle uyumlu hale getirmek ve farklı altyapı katmanları arasında veri hareketini en aza indirmek.IBM bunu, AI uygulamaları için performansı artırırken ve veri yerelliğini artırırken dağıtımı basitleştirmek için bir araç olarak konumlandırıyor..

Ölçekte Vektör Veritabanı


IBM'in CAS uygulamasının merkezinde anlamsal arama için optimize edilmiş bir vektör veritabanı bulunmaktadır.Yapay zeka sistemlerinin, kosinüs benzerliği veya L2 mesafe gibi benzerlik ölçümlerine dayanarak ilgili veri parçalarını almasını sağlayanBu yetenek, kullanıcı sorgularının vektörlere dönüştürüldüğü ve bağlamdan haberdar yanıtlar sunmak için endekslenmiş kurumsal verilerle eşleştirildiği RAG için temeldir.


son şirket davası hakkında IBM, RAG İş Yükleri İçin İçerik Duyarlı Depolama Tanıttı  0
IBM CAS Grafiği: IBM

IBM Research, Samsung ve NVIDIA ile işbirliği içinde, tek bir sunucuda 100 milyar vektöre kadar ölçeklendirilebilen bir prototip sistemi sergiledi.Sistem yüzde 90'dan fazla geri çağırma ve hassasiyet elde etti.Bu ölçek, veri kümelerinin milyarlarca dosyayı kapsayabildiği ve bir kez tam olarak indekslendiğinde,Yüz milyarlarca vektöre kadar büyüyebilir..

RAG boru hattı entegrasyonu


RAG, model yeniden eğitimine gerek kalmadan çıkış doğruluğunu arttırdığı için kurumsal AI için tercih edilen bir yaklaşım haline geliyor.Bir vektör veritabanından alınan kurumsal özel verilerle istekleri tamamlayarak çalışır..

Boru hattı, PDF'ler ve sunumlar gibi belgelerin ayrıştırıldığı, parçalara ayrıldığı ve gömülmeye dönüştürüldüğü veri alımıyla başlar.Bu yerleştirmeler verileri verimli benzerlik araması için düzenleyen bir vektör veritabanında depolanırSorgu sırasında, kullanıcı girişi gömülü ve depolanan vektörlerle eşleştirilir ve ilgili içerik bağlam olarak dil modeline aktarılır.Bu topraklama mekanizması halüsinasyonları azaltır ve yapay zeka ürettiği sonuçlara güvenini arttırır..

IBM'in CAS, tüm bu boru hattını doğrudan depolamaya entegre ederek, içme, indeksleme ve verilerin yakınında geri alımını birleştirir.

Ölçek ve Maliyet Zorluklarının Çözümü


Kurumsal depolama sistemleri zaten petabayt ölçeğinde çalışmaktadır. CAS'e genişletildiğinde, her dosya yüzlerce vektör üretebilir ve veri kümesi boyutunu hızla genişletebilir.Geleneksel vektör veritabanları genellikle birden fazla sunucu üzerinde ölçeklendirilir, ek maliyetler ve operasyonel karmaşıklık getirir. Büyük veri kümelerinin indekslenmesi ve yeniden indekslenmesi de zaman alıcı görevler haline gelir.

IBM'nin yaklaşımı, altyapı yayılmasını sınırlamak için vektör yoğunluğunu iyileştirmeye ve endeksleme başlığını azaltmaya odaklanır.depolama ve hesaplama kaynaklarının bağımsız ölçeklendirilmesini sağlamakBu, IBM Storage Scale ve yüksek performanslı paralel dosya sistemi sayesinde mümkündür.

Depolama ve donanım mimarisi


CAS uygulaması, AI ve yüksek performanslı iş yükleri için tasarlanmış tamamen flash bir platform olan IBM Depolama Ölçeği Sistemi 6000'i (ESS 6000) kullanıyor.Sistem, 4U kabın başına 48'e kadar NVMe sürücüsünü destekler, 7 TB'den 60 TB'ye kadar değişen bireysel sürücü kapasiteleri ile. PCIe Gen5, 400 Gb InfiniBand veya 200 Gb Ethernet bağlantısını entegre eder,düğüm başına 340 GB/s okuma ve 175 GB/s yazma verimi sağlayan, 7 milyon IOPS'ye kadar.

Platform ayrıca depolama ve GPU'lar arasındaki doğrudan veri yollarını kolaylaştıran NVIDIA GPUDirect Storage'i ve ağ ve veri işleme görevlerini boşaltmak için BlueField-3 DPU'larını destekler.

Samsung PM9D3a PCIe Gen5 NVMe SSD'leri yüksek verimli, yüksek yoğunluklu depolama sağlar.12 GB/s'ye kadar sıralı okuma hızı ve 6'ya kadar yazma hızı ileTicari olarak mevcut kurumsal SSD'lerin kullanımı, mimarinin standart bileşenler kullanarak ölçeklenmesini sağlar.

Hiyerarşik İndeksleme ve GPU Hızlandırması


Ölçekte endekslemeyle başa çıkmak için, IBM bağımsız olarak optimize edilebilen birden fazla alt endeksten oluşan hiyerarşik bir indeksleme modeli geliştirdi.Bu yapı, tüm veri kümesini bozmadan artan güncellemeleri ve yerelleştirilmiş yeniden indekslemeyi sağlar, hem kullanılabilirliği hem de operasyonel verimliliği artırıyor.

GPU hızlandırması, yalnızca CPU yaklaşımlarına kıyasla indeksleme süresini önemli ölçüde azaltır.100 milyar vektör için indeks oluşturmak 6 NVIDIA H200 GPU ile 4 gün sürdü., çift soketli bir CPU sisteminde tahmin edilen 120 güne kıyasla.

Vektörler ve indeksler dahil olmak üzere tüm veri kümesi yaklaşık 153 TiB depolama alanı tüketti.Sonuçta elde edilen sistem, %90 hatırlama ile 694ms ortalama sorgu gecikmesi sağladı., kaba kuvvet temel gerçek hesaplamalarına karşı doğrulanmıştır.

Yol Haritası


IBM ve NVIDIA, indeksleme ve sorgu gecikmesini azaltmaya odaklanarak platformu optimize etmeye devam ediyor.Verilerin alınma süresini dokuz günden bir güne düşürmek, ve sorgu gecikmesini yüzde 90'lık hatırlamayı korurken 50-100 milisaniye aralığına düşürür.

Standart dosya sistemlerine vektör indekslemeyi entegre etmek, dağıtımını basitleştirmeyi ve kurumsal AI'nin benimsenmesine engel olan engelleri azaltmayı amaçlıyor.IBM, AI destekli altyapının temel katmanı olarak CAS'i konumlandırıyor.

Pekin Qianxing Jietong Technology Co., Ltd.
Sandy Yang, Küresel Strateji Direktörü
WhatsApp / WeChat: +86 13426366826
E-posta: yangyd@qianxingdata.com
Site: www.qianxingdata.com/www.storagesserver.com
İş odaklı:
İKT Ürün dağıtım/Sistem entegrasyonu ve hizmetler/altyapı çözümleri
20+ yıllık BT dağıtım deneyimiyle, güvenilir ürünler ve profesyonel hizmetler sunmak için önde gelen küresel markalarla ortaklık kuruyoruz.
Akıllı bir dünya inşa etmek için teknolojiyi kullanmak güvenilir İKT ürün hizmet sağlayıcınız!
İletişim bilgileri
Beijing Qianxing Jietong Technology Co., Ltd.

İlgili kişi: Ms. Sandy Yang

Tel: 13426366826

Sorgunuzu doğrudan bize gönderin (0 / 3000)