MIT ve Tufts Üniversitesi araştırmacıları, blok silme-yazma işlemleri ve çöp toplama nedeniyle oluşan performans yavaşlamalarını azaltan, birleştirilmiş SSD'ler için performans artırıcı bir yönetim şeması geliştirdiler.
Sandook adı verilen bu şema, depolama sunucularında çalışan aracı yazılımlardan alınan telemetri ile beslenen iki katmanlı bir kontrol yapısı kullanarak SSD'lerin kısa vadeli ve uzun vadeli performans sınırlayıcı özelliklerini ayırır.
SSD performansı, okuma ve yazma isteklerinin karışımına bağlı olarak önemli ölçüde dalgalanabilir. Yazma işlemleri blok düzeyinde bir silme ve yeniden yazma döngüsü gerektirdiğinden, okumalardan çok daha yavaştır ve yoğun yazma trafiği genel okuma performansını düşürebilir. Performans ayrıca farklı satıcıların SDS kurulumlarında ve hatta aynı üreticinin ve grubun SSD'leri arasında bile değişiklik gösterebilir. Bir SSD denetleyicisi bir blok içindeki silinmiş hücreleri geri kazandığında, geçerli verileri kopyalamalı, bloğu silmeli ve boş havuza geri döndürmelidir - bu işlem çöp toplama olarak bilinir. Bu işlem tipik olarak her SSD denetleyicisi tarafından bağımsız olarak yönetilir ve ani, önemli performans düşüşlerine yol açabilir.
Araştırmacılar, işlem düğümleri ve depolama sunucularından oluşan bir işlem kümesi öngörüyorlar. İşlem kümesi içinde, işlem sunucularındaki istemci yazılımları ve depolama sunucularındaki aracı yazılımlarla birlikte merkezi bir denetleyici çalışır. Depolama sunucuları, her biri kendi yerel denetleyicisi ile donatılmış standart, hazır SSD'ler kullanır.
Sandook Denetleyicisi, her birinin IOPS yetenekleri gibi performans temel çizgilerini belirlemek için profilini çıkardığı tüm SSD'lerin bir kaydını tutar. Bireysel sürücülere okuma veya yazma modları atar ve depolama sunucularındaki Sandook aracılarından her 200 ms'de bir gerçek zamanlı performans güncellemeleri alır. Bu verileri kullanarak, kümenin küresel G/Ç talebine göre ayarlanmış okuma ve yazma ağırlıklarını hesaplar ve bu zamanlama kararlarını işlem sunucularındaki Sandook istemci yazılımıyla paylaşır.
Okumalar için Sandook, okuma isteklerini farklı SSD'lerdeki kopyalar arasında esnek bir şekilde yönlendirmek için zaten hata toleransı için kullanılan mevcut blok çoğaltmasından yararlanır. Yazmalar için, yazmaların mantıksal blok yerleşiminden bağımsız olarak herhangi bir SSD'ye yönlendirilmesine izin veren bir günlük yapılandırılmış tasarım kullanır. Bu yüksek derecede esneklik, zamanlama politikalarının kısıtlama olmaksızın uygulanabilmesini sağlar.
Sandook istemci yazılımı, uygulamalara standart bir blok aygıtı arayüzü sunar, G/Ç isteklerini denetleyicinin zamanlama kurallarına göre en uygun SSD'lere şeffaf bir şekilde yönlendirir. Ayrıca depolama tarafındaki aracı yazılımlardan gerçek zamanlı SSD durumu alır ve çöp toplama sırasında bir SSD'nin önceliğini düşürebilir. Okuma ve yazma istekleri daha sonra diğer sürücülere yönlendirilir, bu da genel depolama sisteminde aşırı kuyruk gecikmesini önler.
Sandook aracıları (1) istemcilerden gelen okuma ve yazma komutlarını işler ve hedef SSD'lere iletir; (2) denetleyicinin zamanlamasını desteklemek için periyodik profil çıkarma ve gerçek zamanlı durum sinyalleri dahil olmak üzere donanımdan bağımsız izleme sağlar; ve (3) SSD tıkanıklık sinyallerini istemcilere iletir, böylece çöp toplama gibi kısa vadeli olaylar sunucudaki diğer SSD'lere G/Ç kaydırılarak yerel ve anında ele alınabilir.
Depolama sunucusu başına onlarca SSD'yi izlemenin bellek ve CPU yükü minimaldir.
Araştırmacılar Sandook'u dört iş yükü altında değerlendirdiler:
- LeanStore: çok çekirdekli CPU'lar ve NVMe SSD'ler için optimize edilmiş yüksek performanslı bir OLTP depolama motoru.
- Makine öğrenmesi: 180 GB'lık bir veri kümesi üzerinde PyTorch ile bir Unet3D CNN modeli eğitiyor.
- LZ4: ImageNet ILSVRC2015 veri kümesi üzerinde görüntü sıkıştırma.
- Depolama sunucusu: gecikmeye duyarlı uygulamalara hizmet veren yüksek performanslı açık kaynaklı bir blok depolama sunucusu.
Genel olarak Sandook, yalnızca performans değişkenliğinin bir kaynağını ele alan mevcut sistemlere kıyasla ham G/Ç verimini %30-82 oranında artırırken, milisaniyenin altında kuyruk gecikmesini korur. Bir SSD havuzunu paylaşan değiştirilmemiş uygulamalar için uçtan uca performans %12-94 oranında iyileşir.
Özellikle, önceki sistemlere kıyasla 1,7 kat daha yüksek depolama verimi, 1,12-1,94 kat daha yüksek uygulama verimi, %71-88 daha düşük gecikme ve %23 daha yüksek GPU kullanımı sağlar - özel donanım veya uygulama değişikliklerine gerek kalmadan.
Sandook makalesi, “Veri Merkezi SSD'lerinin Performans Değişkenliğini Yöneterek Potansiyellerini Ortaya Çıkarma” başlığıyla indirilebilir bir PDF olarak mevcuttur. Çalışma, 4-6 Mayıs tarihleri arasında Renton, Washington'da düzenlenecek olan USENIX Ağ Sistemleri Tasarımı ve Uygulaması Sempozyumu'nda (NSDI 2026) sunulacaktır.
Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Global Strateji Direktörü
WhatsApp / WeChat: +86 13426366826
E-posta: yangyd@qianxingdata.com
Web sitesi: www.qianxingdata.com/www.storagesserver.com
İş Odak Noktası:
BT Ürün Dağıtımı/Sistem Entegrasyonu ve Hizmetleri/Altyapı Çözümleri
20 yılı aşkın BT dağıtım deneyimiyle, güvenilir ürünler ve profesyonel hizmetler sunmak için önde gelen küresel markalarla ortaklık yapıyoruz.
“Akıllı Bir Dünya İnşa Etmek İçin Teknolojiyi Kullanmak” Güvenilir BT Ürün Hizmet Sağlayıcınız!