RAID-Controller für PRIMERGY
Transcription
RAID-Controller für PRIMERGY
WHITE PAPER RAID-CONTROLLER-PERFORMANCE WHITE PAPER FUJITSU PRIMERGY SERVER RAID-CONTROLLER-PERFORMANCE Diese technische Dokumentation richtet sich an Personen, die sich mit der Disk-I/OPerformance von Fujitsu PRIMERGY Servern beschäftigen. Das Dokument soll helfen, aus dem Performance-Blickwinkel die Möglichkeiten und Anwendungsgebiete der verschiedenen RAID-Controller für interne Disk-Subsysteme kennenzulernen. Abhängig von den Anforderungen an Datensicherheit und Performance sowie geplanter oder vorhandener Server-Konfiguration ergeben sich spezifische Empfehlungen für die Auswahl und Parametrisierung der Controller. Version 1.0a 2011-09-07 Inhalt Dokumenthistorie ................................................... 2 Einführung .............................................................. 3 RAID-Controller für PRIMERGY: Grundlagen ....... 4 Vorstellung der RAID-Controller ......................... 4 Controller-Schnittstellen und ihre Durchsätze .... 6 Performance-relevante Einstellungen ................ 8 Besonderheiten der Onboard-Controller .......... 10 Messumfeld .......................................................... 11 Messverfahren .................................................. 11 Messumgebung ................................................ 12 Controller-Vergleich ............................................. 14 RAID 0, 1 und 10 (bis zu vier Festplatten) ....... 15 RAID 0 und 10 (mehr als vier Festplatten) ....... 19 RAID 5 .............................................................. 26 Geringere Lastniveaus ..................................... 31 Fazit...................................................................... 32 Literatur ................................................................ 33 Kontakt ................................................................. 33 © Fujitsu Technology Solutions 2011 Seite 1 (33) WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 Dokumenthistorie Version 1.0 Seite 2 (33) © Fujitsu Technology Solutions 2011 WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 Einführung Festplatten sind sowohl besonders sicherheitsrelevante als auch Performance-kritische Komponenten im Server-Umfeld. Daher ist es wichtig, durch eine intelligente Organisierung dieser Komponenten deren Performance so zu bündeln, dass sie nicht zum Engpass im System werden, und gleichzeitig gegen den Ausfall einer Einzelkomponente gefeit zu sein. Hierfür gibt es Methoden, mehrere Festplatten in einem Verband derart zu arrangieren, dass der Ausfall einer Festplatte verkraftet werden kann. Man nennt dies „Redundant Array of Independent Disks“ oder kurz RAID. Typischerweise werden dafür spezielle RAIDController verwendet. Die verschiedenen PRIMERGY Server sind in unterschiedlichen internen Ausbauvarianten mit verschiedenen RAID-Controller- und Festplattenkonfigurationen verfügbar. Das für alle Server der PRIMERGY Familie einheitlich angebotene „Modular RAID“-Konzept besteht aus einer modularen Controller-Familie und einem einheitlichen Management durch die Fujitsu RAID-Manager-Software „ServerView RAID“. Das umfangreiche Angebot der RAID-Lösungen ermöglicht dem Anwender, den passenden Controller für sein Anwendungsszenario zu wählen. Dabei wird die Leistungsfähigkeit des DiskSubsystems durch den Controller, die Auswahl der Festplatten und die Eigenschaften des RAID-Levels bestimmt. Um alle diese Aspekte des „Modular RAID“ hinsichtlich ihrer Performance zu beleuchten, sind im Rahmen der PRIMERGY White Paper Reihe verschiedene Dokumente entstanden: Zur umfassenden Einführung in die Thematik der Disk-I/O-Performance sei das White Paper „Grundlagen Disk-I/O-Performance“ empfohlen. Das Dokument „Performance einzelner Festplatten“ stellt die aktuell für PRIMERGY verfügbaren Festplatten und ihre Leistung in unterschiedlichen Anwendungsszenarien vor. Das vorliegende Dokument „RAID-Controller-Performance“ behandelt alle aktuell für PRIMERGY angebotenen RAID-Controller und deren Performance. Das Dokument „RAID-Performance“ stellt die einzelnen RAID-Levels gegenüber und gibt Hinweise über Performance und optimale Konfiguration. Bei der Dimensionierung von internen Disk-Subsystemen für PRIMERGY Server kann man so vorgehen, dass man sich einen geeigneten Festplattentyp auswählt und die benötigte Festplattenanzahl für den gewünschten RAID-Level nach Faustformeln abschätzt. Der RAID-Controller ergibt sich dann von selbst durch Anzahl und Technologie der anzuschließenden Festplatten sowie durch den gewünschten RAIDLevel. Das kann jahrelang ausreichend sein, um ein Disk-Subsystem treffsicher zu dimensionieren. In Laufe der Zeit schreitet jedoch die Technologie bei den Speichermedien (beispielsweise Solid State Disks, kurz SSDs) oder bei den internen Schnittstellen des Servers fort und das neue Disk-Subsystem genügt nicht mehr den gestiegenen Ansprüchen. Oder, in einer produktiven Server-Konfiguration ändert sich das Anwendungsszenario und die erzielte Disk-I/O-Performance ist trotz ausreichender Festplattenanzahl nicht wie erhofft. In diesen beiden Fällen kann es lohnend sein, sich etwas genauer mit dem Performance-Einfluss des RAID-Controllers zu beschäftigen. Manchmal ist der richtige Controller, oder auch einfach der richtig konfigurierte Controller, die Voraussetzung für bestmögliche Performance. Damit ist das Ziel des vorliegenden Dokumentes umrissen. Zuerst wird ein Überblick über die für PRIMERGY Systeme zur Verfügung stehenden internen RAID-Controller gegeben. Die maximalen Durchsätze der beteiligten Controller-Schnittstellen werden dann unter Performance-Aspekten vorgestellt. Nach einer kurzen Einführung in das Messumfeld werden die unterschiedlichen RAID-Controller bei verschiedenen RAID-Levels und in unterschiedlichen Anwendungsszenarien verglichen, was durch Messergebnisse untermauert wird. Zur Abgrenzung zu anderen Speichermedien wurde in der Vergangenheit der Begriff „Festplatte“ oder auch „Hard-Disk-Drive“ (HDD) für ein hartmagnetisch beschichtetes, rotierendes, direkt adressierbares, digitales, nichtflüchtiges Speichermedium eingeführt. Im Laufe der technischen Entwicklung wurden zusätzliche „Festplatten“-Gattungen als Speichermedien eingeführt, die die gleiche Schnittstelle zum Server verwenden und vom Server dementsprechend wie Festplatten behandelt werden. Als typisches Beispiel kann man eine SSD anführen, die als elektronisches Speichermedium keine beweglichen Teile beinhaltet, nichtsdestotrotz jedoch umgangssprachlich auch als Festplatte bezeichnet wird. In diesem Dokument wird durchgehend der Begriff „Festplatte“ als Oberbegriff verwendet, während bei einer Differenzierung die Bezeichnungen „SSD“ und „HDD“ verwendet werden. In diesem Dokument sind Festplattenkapazitäten durchgängig zur Basis 10 angegeben (1 TB = 1 Billion 20 Byte), während alle anderen Kapazitäten sowie alle Durchsätze zur Basis 2 angegeben sind (1 MB/s = 2 Byte/s). © Fujitsu Technology Solutions 2011 Seite 3 (33) WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 RAID-Controller für PRIMERGY: Grundlagen In diesem Kapitel werden die für PRIMERGY Server verfügbaren RAID-Controller zunächst einmal mit ihren wesentlichen Funktionalitäten vorgestellt. Anschließend wird näher auf die maximalen Durchsätze eingegangen, die sich für die einzelnen Controller aufgrund ihrer Schnittstellen im Server ergeben. Daraufhin werden die möglichen Einstellungen der Controller behandelt, und abschließend werden die Besonderheiten der Onboard-Controller diskutiert. Vorstellung der RAID-Controller Die folgende Tabelle fasst die wichtigsten Daten zur Funktionalität der verfügbaren RAID-Controller zusammen. Zur vereinfachten Bezeichnung dieser Controller werden im vorliegenden White Paper meist nur die kurzen Namen aus der Spalte „Alias“ verwendet, also beispielsweise LSI2108. Diese ergeben sich aus der BasisChip-Bezeichnung des Controllers und optional der Cache-Größe. Controller Name *) Alias Cache Frequenz Unterstützte Interfaces Max. # Disks RAID Levels BBU Onboard SATA RAID ICH10R ICH10R 3G SATA 4 0, 1, 5*, 10 Onboard SATA RAID Ibex Peak Ibex Peak 3G SATA 4 0, 1, 5*, 10 Onboard SATA RAID Cougar Point Cougar Point 3G SATA 4 0, 1, 5*, 10 RAID 0/1 SAS based on LSI MegaRAID 4Port LSI1064 3G SATA SAS-1.0 PCIe 1.0 x4 4 0, 1, 1E RAID 0/1 SAS based on LSI MegaRAID 8Port LSI1068 3G SATA SAS-1.0 PCIe 1.0 x4 8 0, 1, 1E RAID 5/6 SAS based on LSI MegaRAID 256 MB LSI1078-256 256 MB 3G SATA SAS-1.0 PCIe 1.0 x4 8 0, 1, 5, 6, 10, 50, 60 RAID 5/6 SAS based on LSI MegaRAID 512 MB LSI1078-512 512 MB 3G SATA SAS-1.0 PCIe 1.0 x4 8 0, 1, 5, 6, 10, 50, 60 RAID Ctrl SAS 6G 0/1 (D2607) LSI2008 6G SATA SAS-1.0 SAS-2.0 PCIe 2.0 x8 8 0, 1, 1E, 10 RAID Ctrl SAS 6G 5/6 512 MB (D2616) LSI2108 6G SATA SAS-1.0 SAS-2.0 PCIe 2.0 x8 8 0, 1, 5, 6, 10, 50, 60 512 MB Für einige PRIMERGY Server kann für den Onboard-Controller mittels des zusätzlich bestellbaren „iButton“ RAID 5 aktiviert werden. Die Spalte „Max. # Disks“ gibt die maximale Anzahl Festplatten an, die direkt an dem Controller betrieben werden können. Diese Information kann hilfreich sein, um zu erkennen, ob der Controller einen theoretischen Engpass darstellen könnte. In einigen PRIMERGY Modellen kommen – in Verbindung mit bestimmten Controller-Modellen – sogenannte „Expander“ (spezielle im SAS-Standard definierte Bauteile) zum Einsatz, um die maximale Anzahl der Festplatten darüber hinaus zu erhöhen. Der Expander kann dabei die Bandbreite der vorhandenen Ports nicht steigern, stellt sie aber in Summe allen angeschlossenen Festplatten zur Verfügung. Bei den „RAID 0/1“ SAS-RAID-Controllern ist der LSI2008-Controller der 6G-Nachfolger vom LSI1068Controller, während der LSI2108-Controller der 6G-Nachfolger des LSI1078-Controllers ist, die zusammen die „RAID 5/6“ SAS-RAID-Controllerfamilie bilden. Den LSI1078-Controller gibt es in zwei verschiedenen Cache-Größen, LSI1078-256 und LSI1078-512. Wenn im weiteren Verlauf nur von LSI1078 die Rede ist, gilt die Aussage für beide Controller-Varianten. Seite 4 (33) © Fujitsu Technology Solutions 2011 WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 Bei der Beurteilung der Leistungsfähigkeit von Disk-Subsystemen spielen bei heutigen Systemen die Prozessorleistung und der Speicherausbau des Systems meist keine signifikante Rolle – ein eventuell vorhandener Engpass betrifft in der Regel die Festplatten und den RAID-Controller und nicht CPU oder Memory des Serversystems. Daher können die verschiedenen RAID-Controller unabhängig von den PRIMERGY Modellen verglichen werden, in denen sie eingesetzt werden, auch wenn nicht bei allen PRIMERGYs aufgrund ihrer Ausbaubarkeit mit Festplatten alle Konfigurationen möglich sind. In der folgenden Tabelle ist zusammengestellt, welche RAID-Controller zum Zeitpunkt der Erstellung dieses White Papers in den einzelnen PRIMERGY Systemen für den Anschluss von Festplatten freigegeben sind (oder in der Vergangenheit freigegeben waren) und wie viele Festplatten die Modelle maximal unterstützen. Die möglichen Kombinationen von PRIMERGY Ausbauvarianten und Controllern entnehmen Sie bitte den Konfiguratoren zu den Systemen. PRIMERGY BX620 S5 BX620 S6 BX920 S1 BX920 S2 BX922 S2 BX924 S2 BX960 S1 CX120 S1 CX122 S1 RX100 S6 RX100 S7 RX200 S5 RX200 S6 RX300 S5 RX300 S6 RX600 S4 RX600 S5 RX600 S6 RX900 S1 RX900 S2 SX940 S1 SX960 S1 TX100 S2 TX120 S2 TX120 S3 TX140 S1 TX150 S7 TX200 S5 TX200 S6 TX300 S5 TX300 S6 Max. # Disks 2 2 2 2 2 2 2 2 2 4 4 8 8 12 12 8 8 8 8 8 4 10 4 4 4 8 8 16 16 20 20 Expander OnboardController ICH10R ICH10R ICH10R ICH10R ICH10R IbexPeak CougarPoint ICH10R ICH10R IbexPeak ICH9R CougarPoint CougarPoint IbexPeak ICH10R ICH10R LSI1064 LSI1068 LSI2008 LSI1078- LSI1078256 512 LSI2108 Der LSI1064-Controller ist in den Server Blades BX920 S1 und BX920 S2 schon auf dem Motherboard integriert. Bei dem Server Blade BX920 S2 ist der LSI2108-Controller als Mezzanine-Karte verfügbar, während der LSI1064/LSI1068-Controller bei den Server Blades BX620 S5 und BX620 S6 als SAS-StorageModul bzw. SAS/RAID-Storage-Modul realisiert ist. Diese Varianten sind jedoch nur eine andere technische Realisierung des vergleichbaren PCIe-SteckkartenControllers, die keinen Einfluss auf die Größenordnung der Performance hat. © Fujitsu Technology Solutions 2011 Seite 5 (33) WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 Controller-Schnittstellen und ihre Durchsätze Ein RAID-Controller braucht einerseits eine Schnittstelle zu den Festplatten und andererseits zum Chipsatz des Motherboards. Die erste ist typischerweise SAS oder SATA, die zweite ist typischerweise PCIe oder, im Falle der integrierten Onboard-Controller, eine interne Busschnittstelle des Motherboards. Im Folgenden sind die maximal möglichen Durchsätze von SAS, SATA und PCIe zusammengestellt. SAS und SATA „Serial Attached SCSI“ (SAS) und „Serial Advanced Technology Attachment“ (SATA) sind serielle Schnittstellen für den Anschluss von Festplatten, deren Datendurchsatz von der Frequenz abhängt. Typ Frequenz Theoretischer Durchsatz Praktischer Durchsatz (85%) SAS-1.0, SAS 3G 3000 MHz 286 MB/s 243 MB/s SAS-2.0, SAS 6G 6000 MHz 572 MB/s 486 MB/s SATA, SATA 3G 3000 MHz 286 MB/s 243 MB/s Man findet die Frequenzen in der Abkürzung 3G oder 6G oft als Teil der Controller- oder Festplattenbezeichnung, alternativ wird bei SAS auch eine Versionsnummer 1.0 für 3G und 2.0 für 6G verwendet. Der theoretisch erreichbare Durchsatz errechnet sich folgendermaßen: 1 Bit pro 1 Hz, minus 20% Redundanz der seriellen Übertragung durch die sogenannte 8b/10b-Kodierung. Den in der Praxis erreichbaren Durchsatz kann man daraus durch Multiplikation mit 0.85 abschätzen. Diese 85% sind ein durchschnittlicher Erfahrungswert aus über die Jahre hinweg beobachteten Werten für verschiedenste Komponenten. Alle Komponenten einer Verbindung zwischen Endgeräten müssen dieselbe Version des SAS- oder SATAProtokolls verwenden. Dazu zählen neben den Festplatten auch die Controller und ggf. verwendete Expander. Treffen unterschiedliche Komponenten aufeinander, wird automatisch der performanteste von allen Komponenten gemeinsam unterstützte Standard verwendet, eventuell also eine geringere Frequenz. Dabei sind die höheren Protokolle abwärtskompatibel. Während bei SATA oft jeder Port einzeln an eine Festplatte angeschlossen wird, werden vier SASAnschlüsse bzw. -Leitungen häufig zusammengefasst und als „x4 SAS“ oder „x4 wide port“ bezeichnet. Damit ist der direkte Anschluss von maximal vier SAS-Festplatten über eine Backplane möglich. Der Durchsatz von x4 SAS ist der Vierfache des entsprechenden einzelnen SAS-Anschlusses, dies gilt analog auch für SATA. Schnittstelle Anschluss Frequenz Theoretischer Durchsatz Praktischer Durchsatz (85%) SAS-1.0 1 × x4 3000 MHz 1144 MB/s 973 MB/s SAS-1.0 2 × x4 3000 MHz 2289 MB/s 1945 MB/s SAS-2.0 1 × x4 6000 MHz 2289 MB/s 1945 MB/s SAS-2.0 2 × x4 6000 MHz 4578 MB/s 3890 MB/s SATA 1 × x4 3000 MHz 1144 MB/s 973 MB/s SATA 2 × x4 3000 MHz 2289 MB/s 1945 MB/s Einige PRIMERGY Modelle kann man mit einer größeren Anzahl Festplatten ausbauen, als der Controller Festplatten-Kanäle hat. In diesem Fall wird die Anzahl der anschließbaren Festplatten mittels eines Expanders vergrößert. Wie bereits erwähnt, kann ein Expander den Datenstrom nur verteilen, nicht den Durchsatz erhöhen. Das SAS-Protokoll ist so definiert, dass es auch die SATA-Protokolle gleicher oder geringerer Frequenz transportieren kann (tunneln). Damit ist es Controllern beider SAS-Versionen möglich, mit Festplatten der Standards SATA 1.5 Gbit/s und SATA 3.0 Gbit/s zu kommunizieren. Umgekehrt ist es nicht möglich, SASFestplatten über eine SATA-Schnittstelle anzuschließen. Seite 6 (33) © Fujitsu Technology Solutions 2011 WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 PCIe PCIe ist eine ebenfalls serielle Schnittstelle zwischen dem Controller und dem Motherboard. Die Steckverbindungen sind in unterschiedlicher Breite bzw. Anzahl von Lanes ausgeführt. Üblich sind x4 (vier Lanes) und x8 (acht Lanes), wobei es auf die tatsächliche Anzahl elektrisch genutzter Lanes ankommt (im weiteren Verlauf als „funktionelle PCIe Breite“ bezeichnet). Der Durchsatz einer Lane wird ebenfalls durch die Frequenz bestimmt. Schnittstelle Anschluss Frequenz Theoretischer Durchsatz Praktischer Durchsatz (90%) PCIe 1.0, PCIe Gen1 x4 2500 MHz 954 MB/s 858 MB/s PCIe 1.0, PCIe Gen1 x8 2500 MHz 1907 MB/s 1716 MB/s PCIe 2.0, PCIe Gen2 x4 5000 MHz 1907 MB/s 1716 MB/s PCIe 2.0, PCIe Gen2 x8 5000 MHz 3815 MB/s 3433 MB/s PCIe 1.0 wird auch oft als „PCIe Gen1“ bezeichnet, während PCIe 2.0 auch „PCIe Gen2“ genannt wird. Der theoretisch erreichbare Durchsatz errechnet sich folgendermaßen: 1 Bit pro 1 Hz multipliziert mit der Anzahl der Anschlüsse (x4 oder x8), minus 20% Redundanz der seriellen Übertragung durch die sogenannte 8b/10b-Kodierung. Den in der Praxis erreichbaren Durchsatz kann man daraus durch Multiplikation mit 0.90 abschätzen. Diese 90% sind ein durchschnittlicher Erfahrungswert aus über die Jahre hinweg beobachteten Werten für verschiedenste Komponenten. Alle PRIMERGY Server beginnend mit der 2010 eingeführten Generation (z. B. PRIMERGY RX300 S5) unterstützen PCIe 2.0. Treffen unterschiedliche Komponenten aufeinander, wird ebenfalls die höchste von allen Komponenten gemeinsam unterstützte Frequenz verwendet. Anwendung auf die RAID-Controller In der nächsten Tabelle sind für alle RAID-Controller die Performance-bestimmenden Rahmendaten zusammengestellt. Die hier aufgeführten maximalen Durchsatzwerte ergeben sich mit Hilfe der beiden vorhergehenden Unterkapitel „SAS und SATA“ sowie „PCIe“. Der jeweils maßgebliche Maximaldurchsatz ist in der Tabelle mit Fettdruck hervorgehoben. Controller-Alias Cache Memory Typ # DiskKanäle Maximaler Durchsatz Disk-Interface PCIeVersion Effektive PCIe-Breite Maximaler Durchsatz PCIeInterface ICH10R 4 × SATA 973 MB/s Ibex Peak 4 × SATA 973 MB/s Cougar Point 4 × SATA 973 MB/s 4 × SAS-1.0 973 MB/s 1.0 x4 858 MB/s 8 × SAS-1.0 1945 MB/s 1.0 x4 858 MB/s 8 × SAS-1.0 1945 MB/s 1.0 x4 858 MB/s 8 × SAS-2.0 3890 MB/s 2.0 x4 1716 MB/s x8 3433 MB/s 8 × SAS-2.0 3890 MB/s 2.0 x4 1716 MB/s x8 3433 MB/s LSI1064 LSI1068 LSI1078 DDR2 / 667 MHz LSI2008 LSI2108 DDR2 / 800 MHz Für die Mehrzahl der Einsatzfälle stellen die maximal möglichen Durchsätze keinen Engpass dar. Einmal überwiegen in der Praxis die Anwendungsszenarien mit wahlfreiem Zugriff, in denen zwar hohe Transaktionsraten, aber keine hohen Durchsätze erreicht werden. Für Anwendungsfälle mit rein sequentiellem Zugriff ergibt sich die Limitierung bei PCIe 1.0 erst bei sechs bis sieben konventionellen Festplatten. Die Controller, die PCIe 2.0 unterstützen, und die PRIMERGY Server sind so aufeinander abgestimmt, dass bei den Controllern auch in PCIe-x4-Steckplatz bei maximaler Bestückung des Servers mit leistungsfähigen SAS-2.0-HDDs für rein sequentielle Zugriffe keine nennenswerte Durchsatzlimitierung auftritt. © Fujitsu Technology Solutions 2011 Seite 7 (33) WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 Performance-relevante Einstellungen Wesentlich für eine optimale Performance des RAID-Controllers ist eine richtige Parametereinstellung. Abhängig vom Controller gibt es einen unterschiedlichen Vorrat an Parametern, die einstellbar sind. Zwecks einfacher und sicherer Handhabung der Einstellungen von RAID-Controller und Festplatten empfiehlt sich die für aktuelle Server mitgelieferte RAID-Manager-Software „ServerView RAID“. Üblicherweise wird man – spezifisch für den Anwendungsfall – mittels der vordefinierten Modi „Performance“ oder „Data Protection“ die kompletten Cache-Einstellungen für Controller und Festplatten auf einen Schlag vornehmen. Der Modus „Performance“ gewährleistet für die Mehrzahl der Anwendungsszenarien Performance-optimale Einstellungen. Durch den Modus „Performance“ werden vorhandene Caches von Controller und Festplatten eingeschaltet, daher sollte der Cache des RAID-Controllers in diesem Modus durch eine Battery Backup Unit (BBU) vor Datenverlust bei einem Stromausfall geschützt werden. Zusätzlich sollten auch die Festplatten-Caches durch Einsatz einer unterbrechungsfreien Stromversorgung (USV) gesichert werden. In speziellen Fällen kann eine Parametereinstellung sinnvoll sein, die von den Standardsetzungen des Modus„ „Performance“ abweicht. Falls dies sinnvoll ist, wird im entsprechenden Teil des Kapitels „ControllerVergleich“ darauf hingewiesen. Hinter den Cache-Einstellungen der „ServerView RAID“ Software verbergen sich – abhängig vom Controller – alle oder ein Teil der folgenden Einstellmöglichkeiten von RAID-Controller und Festplatten. Die ersten drei Einstellmöglichkeiten steuern den RAID-Controller, die letzte die Festplatten des RAID-Verbands. Read mode Mit dem Parameter „Read mode“ kann das Cache-Verhalten beim Lesen beeinflusst werden. Es stehen maximal drei Optionen „No read ahead“, „Read ahead“ und „Adaptive“ zur Verfügung. Bei „No read ahead“ findet kein Caching beim Lesen statt. „Read ahead“ bewirkt, dass bei der Anforderung eines Datenblocks bereits auf Verdacht weitere sequentiell nachfolgende Datenblöcke von der Festplatte in den Cache des Controllers eingelesen werden, in der Hoffnung, dass diese in folgenden Aufträgen angefordert werden. Bei der Einstellung „Adaptive“ versucht der Controller selbst zu ermitteln, ob ein Read-ahead sinnvoll ist oder nicht. Write mode Unter dem Begriff „Write mode“ werden die Einstellmöglichkeiten des Controller-Caches zusammengefasst, die die Behandlung von Schreibaufträgen steuern. Es gibt drei Optionen, um den Write-Cache einzustellen: „Write-through“, „Write-back“ und „Always Write-back (independent of BBU state)“. Die Option „Writethrough“ garantiert, dass jeder Schreibauftrag vom Controller erst dann als erledigt zurückgemeldet wird, wenn er von der Festplatte quittiert wurde. Bei den Optionen „Write-back“ und „Always Write-back“ werden die Aufträge im Controller-Cache zwischengespeichert und der Anwendung sofort als erledigt quittiert und erst später an die Festplatte übergeben. Diese Prozedur ermöglicht eine optimale Ausnutzung der Controller-Ressourcen, eine schnellere Abfolge der Schreibaufträge und damit einen höheren Durchsatz. Eventuelle Stromausfälle können durch eine optionale BBU überbrückt werden und die Integrität der Daten im Controller-Cache ist damit garantiert. Die Option „Always Write-back“ schaltet den Write-Cache permanent ein; er wird auch dann genutzt, wenn der Akku der BBU leer ist oder keine BBU installiert ist, während bei der Option „Write-back“ automatisch auf „Write-through“ umgeschaltet wird, solange der Controller-Cache nicht Akku-gepuffert ist. Cache mode Der Parameter „Cache Mode“, manchmal auch mit „I/O Cache“ bezeichnet, beeinflusst das Verhalten des Controller-Caches beim Lesen. Die Option „Direct“ legt fest, dass die zu lesenden Daten direkt von der Festplatte gelesen werden und auch nicht in dem Controller-Cache aufbewahrt werden. Die Alternative „Cached“ bewirkt, dass zuerst versucht wird, die Daten im Controller-Cache zu finden und den Leseauftrag damit zu befriedigen, bevor auf die Festplatte zugegriffen wird. Dabei werden alle Daten in den ControllerCache geschrieben, um für folgende Leseaufträge verfügbar zu sein. Disk cache mode Die möglichen Werte sind „enabled” und „disabled”. Das Einschalten des Festplatten-Caches bringt in den meisten Fällen eine Durchsatzsteigerung beim Schreibzugriff. Ist das System mit einer USV gesichert, so ist das Einschalten des Festplatten-Caches aus Performance-Gründen zu empfehlen. Seite 8 (33) © Fujitsu Technology Solutions 2011 WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 In der nächsten Tabelle ist dargestellt, welche dieser Einstellmöglichkeiten für die einzelnen Controller existieren. Read mode Controller-Alias Read ahead / No read ahead Onboard-Controller ICH10R Onboard-Controller Ibex Peak Onboard-Controller Cougar Point Write mode Cache mode Adaptive LSI1064 LSI1068 LSI1078 LSI2008 LSI2108 Zur Vervollständigung gibt die folgende Tabelle noch eine Zusammenstellung der Einstellungen, die derzeit in den Modi „Data Protection“ und Performance“ in ServerView RAID implementiert sind. Man beachte, dass die Einstellungen bei den Controllern mit Controller-Cache auch von der Existenz einer BBU abhängen und unabhängig vom RAID-Level gesetzt werden. ControllerAlias BBU? Data Protection Read mode Write mode Cache mode Performance Disk cache Read mode Write mode Cache mode Disk cache Onboard-Controller ICH10R Read ahead off Read ahead on Onboard-Controller Ibex Peak Read ahead off Read ahead on Onboard-Controller Cougar Point Read ahead off Read ahead on LSI1064 off LSI1068 on off LSI1078 Read ahead Writethrough Direct Read ahead Writeback Direct LSI2008 on off Read ahead Always Write-back Direct on off Read ahead Writeback Direct on off LSI2108 on Read ahead Writethrough Direct off Read ahead Always Write-back Direct on Read ahead Writeback Direct off Read ahead Writeback Direct on © Fujitsu Technology Solutions 2011 Seite 9 (33) WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 Besonderheiten der Onboard-Controller Einige PRIMERGY Modelle bieten mit einem Onboard-Controller – ICH10R, IbexPeak oder CougarPoint – eine einfache, kostengünstige Einsteigerlösung für den Betrieb mit bis zu vier SATA-Festplatten. Mit der Unterstützung von RAID 0, RAID 1 und RAID 10 bietet ein solcher Onboard-Controller eine Reihe von gebräuchlichen RAID-Levels an und belegt keinen PCIe-Steckplatz. Alle Controller, die über die PCIe-Schnittstelle angebunden sind, werden hier nicht als Onboard-Controller behandelt, auch wenn sie auf dem Motherboard integriert sind (siehe Tabelle im Kapitel „Vorstellung der RAID-Controller“). Der Onboard-Controller ist als eine Firmware-/Treiber-basierte Software-RAID-Lösung realisiert. Sie ist typischerweise im „Southbridge“-Chip integriert, der zum Motherboard-Chipsatz gehört. In allen hier behandelten Fällen bietet er vier SATA-Ports (3 Gbit/s). Während der Boot-Phase werden Zugriffe auf den RAID-Verband durch die Firmware realisiert. Sobald das Betriebssystem aktiv ist, übernehmen geeignete Treiber diese Aufgabe. Der Onboard-Controller hat keinen eigenen Prozessor, sondern nutzt die CPU des Serversystems für die RAID-Funktionalität. Der anteilige Konsum von Prozessorleistung des Servers fällt bei neueren Servern immer weniger ins Gewicht. Als Beispiel sei eine PRIMERGY TX200 S6 mit 2 × Xeon E5506 (2.13 GHz), also mit einer CPU aus dem Jahre 2009, und einem ICH10R-Chip genannt. Selbst wenn man auf diesem System die maximal möglichen vier SATA-SSDs mit Festplattenaufträgen auslastet, werden nicht mehr als 10% der CPU-Leistung zur Unterstützung des Onboard-Controllers konsumiert. Obwohl zur effektiven Benutzung dieses Typs von Controllern nur der Modus „RAID“ in Frage kommt, seien der Vollständigkeit halber alle Modi dieser SATA-Controller vorgestellt. Die fortgeschrittenen SATA-Features „Native Command Queuing“ (NCQ) und „hot swapping“ werden nicht in allen Fällen unterstützt. Es können bis zu vier Modi sein: RAID Aufgrund seiner Flexibilität empfehlenswerter Modus. Nur hierbei ist eine problemlose Migration einer SATA-HDD von einer Nicht-RAID- zu einer RAID-Konfiguration möglich. Alle Funktionalitäten von SATA werden unterstützt, also auch NCQ und „hot swapping“. Für die unterstützten RAID-Levels ist bei den PRIMERGY Servern eine Firmware namens „LSI Logic Embedded MegaRAID“ im Controller-BIOS integriert. Nur in diesem Modus sind RAID-Verbände bereits während der Boot-Phase möglich, und nur in diesem Modus sind Controller und Festplatten in der RAID-Manager-Software „ServerView RAID“ sichtbar und können dort verwaltet werden. Es sind spezielle Treiber notwendig. AHCI AHCI steht für „Advanced Host Controller Interface“ und ist ein herstellerübergreifender Schnittstellenstandard für SATA-Controller. NCQ und „hot swapping“ werden unterstützt. Auch für AHCI sind spezielle Treiber im Betriebssystem notwendig. Compatible Die SATA-Ports werden als PATA-Ports (PATA = parallel ATA, Vorgänger des SATAStandards) emuliert. Als Konsequenz dieser Emulation wird NCQ nicht unterstützt. Dieser Betriebsmodus sollte nur dann verwendet werden, wenn das verwendete Betriebssystem keine SATA-Treiber für den verwendeten „Southbridge“-Chip bietet oder diese aus anderen Gründen nicht eingesetzt werden sollen. Native In dieser Betriebsart werden die SATA-Ports als solche dem Betriebssystem sichtbar gemacht. NCQ wird nicht unterstützt. Es werden entsprechende SATA-Treiber benötigt, die auf der Fujitsu „ServerStart DVD“ für verschiedene Betriebssysteme mitgeliefert werden. Seite 10 (33) © Fujitsu Technology Solutions 2011 WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 Messumfeld Nachdem nun die unterschiedlichen Controller vorgestellt und ihre technischen Eigenschaften erläutert worden sind, wollen wir im nachfolgenden Kapitel „Controller-Vergleich“ die Controller in verschiedenen Anwendungsszenarien diskutieren und dies anhand von Messergebnissen untermauern. Daher seien zuerst das Messverfahren und die Messumgebung an dieser Stelle kurz vorgestellt. Alle Details des Messverfahrens und Grundlagen zur Disk-I/O-Performance sind im White Paper „Grundlagen Disk-I/O-Performance“ beschrieben. Messverfahren Standardmäßig werden Performance-Messungen von Disk-Subsystemen bei PRIMERGY Servern mit einem definierten Messverfahren durchgeführt, das die Festplattenzugriffe realer Anwendungsszenarien anhand von Kenndaten modelliert. Die wesentlichen Kenndaten sind: Anteil von wahlfreien Zugriffen / sequentiellen Zugriffen Anteil der Zugriffsarten Lesen / Schreiben Blockgröße (kB) Anzahl paralleler Zugriffe (# of Outstanding I/Os) Eine gegebene Wertekombination dieser Kenndaten heißt „Lastprofil“. Die folgenden fünf Standardlastprofile lassen sich typischen Anwendungsszenarien zuordnen: Standardlastprofil Zugriff Zugriffsart read write Blockgröße [kB] Anwendung File copy wahlfrei 50% 50% 64 Kopieren von Dateien File server wahlfrei 67% 33% 64 File-Server Database wahlfrei 67% 33% 8 Datenbank (Datentransfer) Mail Server Streaming sequentiell 100% 0% 64 Datenbank (Log-File), Datensicherung; Video Streaming (teilweise) Restore sequentiell 0% 100% 64 Wiederherstellen von Dateien Zur Modellierung parallel zugreifender Anwendungen mit unterschiedlicher Belastungsintensität wird die „# of Outstanding I/Os” mit 1, 3, 8 beginnend bis 512 gesteigert (ab 8 in Zweierpotenzschritten). Die Messungen des vorliegenden Dokumentes beruhen auf diesen Standardlastprofilen. Die wichtigsten Ergebnisse einer Messung sind: Throughput [MB/s] Transactions [IO/s] Latency [ms] Datendurchsatz in Megabytes pro Sekunde Transaktionsrate in I/O-Operationen pro Sekunde mittlere Antwortzeit in ms Für sequentielle Lastprofile hat sich der Datendurchsatz als übliche Messgröße durchgesetzt, während bei den wahlfreien Lastprofilen mit ihren kleinen Blockgrößen meist die Messgröße „Transaktionsrate“ verwendet wird. Datendurchsatz und Transaktionsrate sind direkt proportional zueinander und lassen sich nach der Formel Datendurchsatz [MB/s] = Transaktionsrate [IO/s] × Blockgröße [MB] Transaktionsrate [IO/s] = Datendurchsatz [MB/s] / Blockgröße [MB] ineinander überführen. © Fujitsu Technology Solutions 2011 Seite 11 (33) WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 Messumgebung Alle in diesem Dokument diskutierten Messergebnisse wurden mit den im Folgenden aufgelisteten Hardware- und Software-Komponenten ermittelt: System under Test (SUT) Modelle PRIMERGY RX300 S6 PRIMERGY TX120 S3 PRIMERGY TX150 S7 PRIMERGY TX200 S6 Betriebssystem Windows Server 2008, Enterprise Edition Version: 6.0.6001 Service Pack 1 Build 6001 RAID Manager Software ServerView RAID Manager 5.0.2 Initialisierung von RAIDRAID-Verbände werden vor der Messung mit einer elementaren Blockgröße von 64 kB Verbänden („Stripe Size“) initialisiert Dateisystem NTFS Messwerkzeug Iometer 2006.07.27 Messdaten Messdateien von 32 GB bei 1 – 8 Festplatten; 64 GB bei 9 – 16 Festplatten Onboard SATA Controller Intel 82801JR I/O Controller Hub, ICH10R (in PRIMERGY TX200 S6) „ICH10R“ Driver Name: megasr1.sys, Driver Version: 13.2.0614 BIOS: A 09.04151432R SATA RAID Modus Onboard SATA Controller Intel BD3420 PCH, Ibex Peak (in PRIMERGY TX150 S7) „Ibex Peak” Driver Name: megasr1.sys, Driver Version: 13.2.0614 BIOS: A 09.07211059R SATA RAID Modus Onboard SATA Controller Intel BD82C202 PCH, Cougar Point (in PRIMERGY TX120 S3) „Cougar Point“ Driver Name: megasr1.sys, Driver Version: 14.04.0322 BIOS: A. 10.03031333R SATA RAID Modus Controller Driver Name: lsi_sas.sys, Driver Version: 1.32.00.04 „RAID 0/1 SAS based on LSI Firmware Version: 1.30.00.00 MegaRAID 4Port” BIOS Version: 2D.35 (LSI MegaRAID SAS 1064) Controller Driver Name: lsi_sas.sys, Driver Version: 1.25.06.22 „RAID 0/1 SAS based on LSI Firmware Version: 1.30.00.00 MegaRAID 8Port” BIOS Version: 2D.35 (LSI MegaRAID SAS 1068) Controller Driver Name: megasas2.sys, Driver Version: 4.23.0.64 „RAID Ctrl SAS 6G 0/1” Firmware Version: 20.7.1-0025 (LSI MegaRAID SAS 2008) BIOS Version: 4.18.00 Controller Driver Name: megasas2.sys, Driver Version: 4.23.0.64 „RAID 5/6 SAS based on LSI Firmware-Paket: 11.0.1-0028 MegaRAID 256 MB” Firmware Version: 1.40.152-0827 (LSI MegaRAID SAS 1078) BIOS Version: 2.07.00 Controller Cache: 256 MB Controller Driver Name: megasas2.sys, Driver Version: 4.23.0.64 „RAID 5/6 SAS based on LSI Firmware-Paket: 11.0.1-0028 MegaRAID 512 MB” Firmware Version: 1.40.152-0827 (LSI MegaRAID SAS 1078) BIOS Version: 2.07.00 Controller Cache: 512 MB Controller Driver Name: megasas2.sys, Driver Version: 4.23.0.64 „RAID Ctrl SAS 5/6 512MB Firmware-Paket: 12.4.0-0031 (D2616)” Firmware Version: 2.40.33-0894 (LSI MegaRAID SAS 2108) BIOS Version: 2.07.00 Controller Cache: 512 MB SATA-HDD Seagate ST9500530NS, 2.5, 500 GB, 7200 rpm, 3 Gb/s SAS-2.0-HDD Seagate ST3146356SS, 2.5, 146 GB, 15000 rpm, 6 Gb/s SATA-SSD Intel SSDSA2SH064G1GC, 2.5, 64 GB, 3 Gb/s Seite 12 (33) © Fujitsu Technology Solutions 2011 WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 Die für den Controller-Vergleich verwendeten Festplattenmodelle sind im Folgenden noch einmal ausführlich zusammen mit ihren grundlegenden Performance-Daten zusammengestellt, da diese für das Verständnis der mit den Controllern erzielten Performance-Werte wichtig sind. Bei den klassischen Festplatten (HDDs) wurden je eine leistungsfähige SATA- und eine SAS-2.0-Festplatte ausgewählt, und eine 64 GB SATA-SSD repräsentiert die Klasse der SATA-SSDs. Dargestellt sind jeweils die mit einer einzelnen Festplatte gemessenen Maximalwerte für die fünf Standardlastprofile im vorhergehenden Unterkapitel „Messverfahren“. In allen Fällen ist der FestplattenCache eingeschaltet, da dies fast immer die optimale Performance garantiert. Festplattentyp KurzBezeichnung (Alias) Sequentieller MaximalDurchsatz [MB/s] 64 kB Blockgröße Lesen Schreiben Maximale Transaktionsraten für wahlfreie Zugriffe [IO/s] 8 kB Blockgröße 64 kB Blockgröße Leseanteil: Leseanteil: 67% HDD SATA, 3 Gb/s, 2.5 500 GB, 7200 rpm hot-plug-fähig Kategorie geschäftskritisch (BC) 67% 50% SATA-HDD 96 MB/s 93 MB/s 181 IO/s 180 IO/s 171 IO/s HDD SAS, 6 Gb/s, 2.5 146 GB, 15000 rpm, Kategorie Enterprise (EP) SAS-2.0-HDD 155 MB/s 155 MB/s 589 IO/s 470 IO/s 454 IO/s SSD SATA, 3 Gb/s, 2.5 64 GB, hot-plug-fähig, Kategorie Enterprise (EP) SATA-SSD 252 MB/s 187 MB/s 8083 IO/s 2023 IO/s 1580 IO/s Diese und weitere Informationen zu den für die PRIMERGY Server freigegebenen Festplatten finden sich im White Paper „Performance einzelner Festplatten“. © Fujitsu Technology Solutions 2011 Seite 13 (33) WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 Controller-Vergleich In den bisherigen Kapiteln sind alle wesentlichen Vorinformationen zu den Controllern gegeben worden. Diese Informationen werden schon in vielen Fällen die Controller-Auswahl für einen gegebenen Anwendungsfall einengen. Wenn weitere kundenseitige Informationen über den geplanten Controller-Einsatz hinzugenommen werden, lässt sich schon sehr viel mehr über die mit den einzelnen Controllern zu erwartende Performance sagen. In diesem Kapitel sollen daher die Controller differenziert für verschiedene RAID-Levels, Anwendungsszenarien, Belastungsintensitäten, Festplattenanzahlen sowie Festplattentechnologien verglichen werden. Die Aussagen werden dabei mit Hilfe von Messergebnissen veranschaulicht. Die Vergleiche sind gegliedert in drei Unterkapitel „RAID 0, 1 und 10 (bis zu vier Festplatten)“, „RAID 0 und 10 (mehr als vier Festplatten)“ und „RAID 5“, die unabhängig voneinander gelesen werden können. Allgemeine Vorbemerkungen zu den Vergleichen: Bei den Vergleichen werden meist die im Kapitel „Messverfahren“ beschriebenen fünf Lastprofile, File copy, Database, File server, Streaming und Restore verwendet. Damit wird eine angemessene Abdeckung der wahlfreien und sequentiellen Anwendungsszenarien erreicht. Wenn das kundenseitige Belastungsprofil wesentlich hiervon abweicht, gelten die hier gemachten Aussagen nicht mehr uneingeschränkt. Als Maß für die Leistungsfähigkeit eines Disk-Subsystems wird wie allgemein üblich bei wahlfreien Lastprofilen die Transaktionsrate in IO/s angegeben, und bei sequentiellen Lastprofilen der Durchsatz in MB/s. Es werden jeweils alle Controller diskutiert, die den gerade betrachteten RAID-Level und Festplattentyp unterstützen. Zwecks besserer Überschaubarkeit beschränken sich die Grafiken des aktuellen Kapitels meist auf die erreichbaren Maximalwerte. Diese werden in der Regel erst bei einer hohen Belastungsintensität des Disk-Subsystems erreicht. Exemplarisch für die Festplattentechnologien werden die drei im Kapitel „Messumgebung“ näher behandelten Festplattentypen benutzt (SATA-HDD, SAS-2.0-HDD und SATA-SSD). Dort sind auch deren wesentliche Performance-Daten zusammengestellt. An einigen Stellen in den folgenden Vergleichen werden die erreichten Performance-Werte auf Basis der Performance-Daten dieser Festplattentypen erklärt. Da die maximal mit den Controllern erreichbare Performance Gegenstand dieses Dokumentes ist, wurden für die Messungen die unveränderten Cache- und Festplatteneinstellungen von „ServerView RAID“ im Modus „Performance“ zugrunde gelegt, und nicht die des Modus„ „Data Protection“. Bei ausreichender kundenseitiger Absicherung gegen Stromausfälle ist diese Einstellung sinnvoll. Wenn eine Änderung dieser Einstellungen vorteilhaft ist, wird das im Einzelfall erwähnt. Konventionelle Festplatten (im Gegensatz zu SSDs) werden bei den nun folgenden ControllerVergleichen nur noch kurz als „HDDs“ bezeichnet. Seite 14 (33) © Fujitsu Technology Solutions 2011 WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 RAID 0, 1 und 10 (bis zu vier Festplatten) Diesen Bereich von Festplattenanzahlen lohnt es gesondert zu betrachten, da nur hier die OnboardController mit den PCIe-Controllern verglichen werden können. Dies geschieht mit der im Kapitel „Messumgebung“ näher beschriebenen SATA-HDD, da alle zu betrachtenden Controller SATA unterstützen. Die Performance-Werte für die einzelnen Lastprofile werden größtenteils durch die HDDs bestimmt, da die Controller bei dieser HDD-Anzahl noch nicht an ihren Grenzen arbeiten. Wahlfreie Zugriffe RAID 1 mit zwei SATA-HDDs Die Grafik zeigt einen Controller-Vergleich für zwei SATA-HDDs konfiguriert als RAID 1. Die drei Säulengruppen in der Grafik stellen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße) dar. Die erreichbare Performance hängt hier nur wenig vom Controller ab. Maximale Transaktionsraten, wahlfreier Zugriff, RAID 1, 2 SATA-HDDs Transaction rate [IO/s] 500 450 400 350 300 250 50 ICH10R IbexPeak CougarPoint LSI1064 LSI1068 LSI2008 LSI1078 LSI2108 100 ICH10R IbexPeak CougarPoint LSI1064 LSI1068 LSI2008 LSI1078 LSI2108 150 ICH10R IbexPeak CougarPoint LSI1064 LSI1068 LSI2008 LSI1078 LSI2108 200 File copy File server Database 0 Im Falle von RAID 1 haben die Controller mit Cache in der Regel eine bessere Performance, wenn man den Controller-Cache abschaltet. Daher beruhen die Transaktionsraten des LSI1078- und des LSI2108Controllers in dieser Grafik auf folgenden Änderungen gegenüber den Standardeinstellungen des Modus„ „Performance“ von ServerView RAID: Read Mode von „Read ahead” nach „No read ahead“ Write Mode von „Always write back” nach „Write through“ Diese Änderungen sind für RAID 1 generell empfehlenswert. © Fujitsu Technology Solutions 2011 Seite 15 (33) WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 RAID 0 mit vier SATA-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des Festplattenverbandes für RAID 0 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). In diesen Fällen liefern alle Controller etwa die gleiche Performance. Maximale Transaktionsraten, wahlfreier Zugriff, RAID 0, 4 SATA-HDDs Transaction rate [IO/s] 1000 900 800 700 600 500 100 ICH10R IbexPeak CougarPoint LSI1064 LSI1068 LSI2008 LSI1078 LSI2108 200 ICH10R IbexPeak CougarPoint LSI1064 LSI1068 LSI2008 LSI1078 LSI2108 300 ICH10R IbexPeak CougarPoint LSI1064 LSI1068 LSI2008 LSI1078 LSI2108 400 File copy File server Database 0 RAID 10 mit vier SATA-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des Festplattenverbandes für RAID 10 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). In diesen Fällen liefern alle Controller etwa die gleiche Performance. 700 600 500 LSI2108 LSI1078 LSI2008 CougarPoint IbexPeak ICH10R LSI2108 LSI1078 LSI2008 CougarPoint IbexPeak ICH10R LSI2108 LSI1078 100 LSI2008 200 IbexPeak 300 CougarPoint 400 ICH10R Transaction rate [IO/s] Maximale Transaktionsraten, wahlfreier Zugriff, RAID 10, 4 SATA-HDDs 0 File copy Seite 16 (33) File server Database © Fujitsu Technology Solutions 2011 WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 Sequentielle Zugriffe RAID 1 mit zwei SATA-HDDs Die nächste Grafik zeigt einen Controller-Vergleich für zwei SATA-HDDs konfiguriert als RAID 1. Die zwei Säulengruppen in der Grafik stellen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße) dar. Insgesamt liegen in der Mehrzahl der Fälle bei diesem RAID-Level die maximalen Durchsätze nahe bei den Grenzwerten einer einzelnen Festplatte. Beim Lesen nutzen der LSI2008-, der LSI1078- und der LSI2108-Controller bei höheren Belastungsintensitäten beide Festplatten und zeigen dadurch einen höheren maximalen Durchsatz. Maximale Durchsätze, sequentieller Zugriff, RAID 1, 2 SATA-HDDs 180 Throughput [MB/s] 160 140 120 100 80 LSI2108 LSI1078 LSI2008 LSI1068 LSI1064 IbexPeak CougarPoint ICH10R LSI2108 LSI1078 LSI2008 LSI1068 LSI1064 CougarPoint 20 ICH10R 40 IbexPeak 60 0 Streaming Restore Im Falle von RAID 1 haben die Controller mit Cache in der Regel eine bessere Performance, wenn man den Controller-Cache abschaltet. Daher beruhen die Transaktionsraten des LSI1078- und LSI2108-Controllers in dieser Grafik auf folgenden Änderungen gegenüber den Standardeinstellungen des Modus„ „Performance“ von ServerView RAID: Read Mode von „Read Ahead” nach „No read ahead“ Write Mode von „Always write back” nach „Write through“ Diese Änderungen sind für RAID 1 generell empfehlenswert. © Fujitsu Technology Solutions 2011 Seite 17 (33) WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 RAID 0 mit vier SATA-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren maximalen Durchsätze des Festplattenverbandes für RAID 0 bei sequentiellen Lastprofilen dar. Die beiden Säulengruppen in der Grafik zeigen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße). In diesen Fällen liefern alle Controller etwa die gleiche Performance. Maximale Durchsätze, sequentieller Zugriff, RAID 0, 4 SATA-HDDs Throughput [MB/s] 500 400 300 LSI2108 LSI1078 LSI2008 LSI1068 LSI1064 IbexPeak CougarPoint ICH10R LSI2108 LSI1078 LSI2008 LSI1068 LSI1064 IbexPeak CougarPoint 100 ICH10R 200 0 Streaming Restore RAID 10 mit vier SATA-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren maximalen Durchsätze des Festplattenverbandes für RAID 10 bei sequentiellen Lastprofilen dar. Die beiden Säulengruppen in der Grafik zeigen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße). In diesen Fällen liefern alle Controller etwa die gleiche Performance. Maximale Durchsätze, sequentieller Zugriff, RAID 10, 4 SATA-HDDs 200 LSI2108 LSI1078 LSI2008 CougarPoint IbexPeak ICH10R LSI2108 LSI1078 LSI2008 50 IbexPeak 100 CougarPoint 150 ICH10R Throughput [MB/s] 250 0 Streaming Seite 18 (33) Restore © Fujitsu Technology Solutions 2011 WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 RAID 0 und 10 (mehr als vier Festplatten) Zum Betrieb von mehr als vier Festplatten in den jetzigen PRIMERGY-Servern reichen die OnboardController nicht mehr aus, daher werden im Folgenden ausschließlich die PCIe-Controller verglichen. Da hierbei speziell die Grenzwerte bei höherem Performance-Bedarf interessieren, werden zur Verdeutlichung Messungen mit meist zwölf leistungsfähigen SAS-2.0-HDDs oder SATA-SSDs benutzt. Diese Festplatten sind im Kapitel „Messumgebung“ näher beschrieben. Die Performance-Aussagen zum LSI1068-Controller beruhen auf Messungen mit acht statt zwölf Festplatten, da acht die maximale Festplattenanzahl des Controllers in Verbindung mit derzeit verfügbaren PRIMERGY Modellen ist. Im Gegensatz zum LSI1068-Controller wird der LSI1064-Controller hier nicht mehr betrachtet, da letzterer in allen freigegebenen Konfigurationen maximal den Anschluss von vier Festplatten erlaubt. Die Performancerelevanten Aspekte dieses Controllers sind ausreichend im vorigen Unterkapitel „RAID 0, 1 und 10 (bis zu vier Festplatten)“ behandelt worden. Wahlfreie Zugriffe Bei der Betrachtung der wahlfreien Zugriffe für größere Anzahlen von Festplatten ist es sinnvoll, zwischen HDDs und SSDs zu unterscheiden, da die Grenzwerte bei SSDs in einer ganz anderen Größenordnung liegen. HDDs Im Folgenden werden die Controller bei wahlfreien Zugriffen auf HDDs verglichen. Hierbei sind die maximalen Transaktionsraten des Speichermediums für das verwendete Lastprofil der wichtigste begrenzende Faktor. Dennoch ist die Performance in solchen Fällen nicht ganz unabhängig vom Controller, da es bei den Controllern ohne Cache (LSI1068 und LSI2008) noch einen zusätzlichen Einfluss gibt, auf den an den entsprechenden Stellen noch hingewiesen wird. Obwohl die nun folgenden Resultate mit bis zu zwölf SAS-2.0-HDDs gewonnen wurden, kann man sie auch verwenden, um für andere Festplattentypen und anzahlen die zu erwartenden maximalen Transaktionsraten abzuschätzen. Die Durchsätze, die bei wahlfreien Zugriffen auf HDDs entstehen, sind so niedrig, dass eventuelle Limitierungen an der PCIe- oder SAS-Schnittstelle der Controller keine Rolle spielen. © Fujitsu Technology Solutions 2011 Seite 19 (33) WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 RAID 0 mit bis zu zwölf SAS-2.0-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des Festplattenverbandes für RAID 0 bei wahlfreien Lastprofilen dar. Wie bereits zuvor erwähnt, wurde der LSI1068-Controller mit acht Festplatten betrieben. Die verwendeten SAS-2.0-Festplatten haben für das Lastprofil „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße) die maximale Transaktionsrate 589 IO/s. Theoretisch sollte also ein Verband aus zwölf solchen Festplatten maximal 589 IO/s × 12 = 7068 IO/s schaffen. Die maximale gemessene Transaktionsrate für das Lastprofil „Database“ beträgt 6951 IO/s; die Überschlagsrechnung wird also gut bestätigt. Für die Lastprofile mit der Blockgröße 64 kB ist bei den hier vorgestellten Messungen nur etwa die halbe Transaktionsrate möglich wie bei dem Lastprofil mit 1 der 8 kB Blockgröße. Maximale Transaktionsraten, wahlfreier Zugriff, RAID 0, bis zu 12 SAS-2.0-HDDs * = 8 HDDs Transaction rate [IO/s] 8000 7000 6000 5000 4000 LSI2108 LSI1078 LSI2008 LSI1068 * LSI2108 LSI1078 LSI2008 LSI1068 * LSI2108 LSI1078 1000 LSI2008 2000 LSI1068 * 3000 0 File copy File server Database Die zwei rechten Säulen in jeder der drei Säulengruppen dieser Grafik stellen die zwei Controller mit Cache dar (LSI1078 und LSI2108). Beide erreichen für jedes der drei Lastprofile ungefähr die maximale Transaktionsrate dieses RAID-Verbandes. Die beiden anderen Controller (LSI1068 und LSI2008) erreichen jeweils nicht mehr als etwa 70% davon. Eine genauere Analyse der Transaktionsraten würde zeigen, dass diese beiden Controller für wahlfreie Lastprofile im Bereich bis zu etwa 32 parallelen Zugriffe ähnliche Performance-Werte haben wie die drei Controller mit Cache. Für höhere Parallelitäten behalten dann der LSI1068- und der LSI2008-Controller die bis dahin erreichten Transaktionsraten bei. Dieser prinzipielle Unterschied zwischen den beiden Gruppen von Controllern bei wahlfreien Zugriffen ist hier exemplarisch für zwölf (bzw. acht) Festplatten dargestellt. Der Unterschied ist auch für RAID-Verbände mit kleineren Festplattenanzahlen relevant, sofern diese eine Performance-Steigerung oberhalb von 32 parallelen Zugriffen zeigen können. Bei den Messungen im Kapitel „RAID 0, 1 und 10 (bis zu vier Festplatten)“ war diese Voraussetzung nicht erfüllt, da dort der kleinere RAID-Verband schon bei etwa 16 parallelen Zugriffen seine maximale Performance erreichte. Daher gab es dort keine signifikanten Performance-Unterschiede zwischen den Controllern ohne Cache (LSI1068 und LSI2008) und den Controllern mit Cache (LSI1078 und LSI2108). 1 Der Grund ist die Initialisierung des RAID-Verbandes mit der elementaren Blockgröße von 64 kB („stripe size“). Das wahlfreie Lastprofil mit der Blockgröße 8 kB, die klein ist gegenüber der „stripe size“, kann direkt nach der Formel HDD-Anzahl × HDD-Performance abgeschätzt werden. Verwendet das Lastprofil die gleiche Blockgröße, mit der der RAID-Verband initialisiert wurde, kann nur etwa die Hälfte davon erreicht werden. Eine ausführliche Begründung würde hier zu weit führen. Die Grundlagen der RAID-Verbände sind ausführlich in dem Dokument „RAIDPerformance“ beschrieben. Seite 20 (33) © Fujitsu Technology Solutions 2011 WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 RAID 10 mit zwölf SAS-2.0-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des Festplattenverbandes für RAID 10 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen in der Grafik zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Der LSI1068-Controller ist hier nicht mehr vertreten, da er RAID 10 nicht unterstützt. Maximale Transaktionsraten, wahlfreier Zugriff, RAID 10, 12 SAS-2.0-HDDs Transaction rate [IO/s] 6000 5000 4000 3000 LSI2108 LSI1078 LSI2008 LSI2108 LSI1078 LSI2008 LSI2108 LSI1078 1000 LSI2008 2000 0 File copy File server Database In der Grafik zeigt sich dasselbe prinzipielle Verhalten wie bei RAID 0. Das heißt: Der Controller ohne Cache (LSI2008) erreicht für alle drei dargestellten Lastprofile maximal etwa 70% der Transaktionsrate der anderen beiden Controller mit Cache. Auch für diesen RAID-Level ist das ein Performance-Unterschied, der sich erst oberhalb von 32 parallelen Zugriffen auf den RAID-Verband ergibt. © Fujitsu Technology Solutions 2011 Seite 21 (33) WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 SATA-SSDs Während bei wahlfreien Zugriffen auf eine einzelne HDD die maximal mögliche Transaktionsrate bei eingeschaltetem Festplatten-Cache normalerweise < 700 IO/s ist, ist sie bei einer SATA-SSD ungefähr um den Faktor zehn größer. Durch eine so hohe Transaktionsrate können Verbände aus mehreren SATA-SSDs auch bei wahlfreien Zugriffen Durchsätze von mehreren hundert MB/s liefern. Das wiederum bedeutet, dass die Ressourcen und Schnittstellen der Controller in viel höherem Maße ausgelastet werden als bei HDDs und die Unterschiede zwischen den Controller-Generationen erkennbar werden. Für diese Fälle hängt die Performance der Controller mit Cache (LSI1078 und LSI2108) wesentlich von der richtigen Wahl der Cache-Einstellungen ab. Gegenüber den Standardeinstellungen des Modus„ „Performance“ von ServerView RAID ist zu ändern: Read Mode von „Read Ahead” nach „No read ahead“ Write Mode von „Always write back” nach „Write through“ Diese Änderungen sind für die RAID-Level 0 und 10 bei wahlfreien Lastprofilen im Zusammenhang mit SSDs generell empfehlenswert. RAID 0 mit bis zu zwölf SATA-SSDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des SATASSD-Verbandes für RAID 0 bei wahlfreien Lastprofilen dar. Wie bereits zuvor erwähnt, wurde der LSI1068Controller mit acht Festplatten betrieben. Die drei Säulengruppen zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Am leistungsfähigsten sind hier der LSI2008- und der LSI2108-Controller. Der erste hat einen Vorsprung beim Lastprofil „File copy“, und der zweite einen deutlicheren Vorsprung beim Lastprofil „Database“. Maximale Transaktionsraten, wahlfreier Zugriff, RAID 0, bis zu 12 SATA-SSDs * = 8 HDDs Transaction rate [IO/s] 50000 45000 40000 35000 30000 25000 20000 LSI2108 LSI1078 LSI2008 LSI1068 * LSI2108 LSI1078 LSI1068 * LSI2008 LSI2108 LSI1078 5000 LSI2008 10000 LSI1068 * 15000 0 File copy File server Database Es ist auch interessant, sich die Durchsatzwerte klarzumachen, die mit diesen Transaktionsraten verbunden sind. Trotz der geringeren Transaktionsraten haben die beiden Lastprofile mit 64 kB Blockgröße die höheren Durchsätze. Der LSI2008-Controller bewältigt beispielsweise beim Lastprofil „File copy“ etwa 1062 MB/s Durchsatz. Drückt man die maximalen Transaktionsraten in Form von SATA-SSD-Anzahlen aus, heißt das: Um beispielsweise im Falle von RAID 0 die Möglichkeiten des LSI2108-Controllers auszuschöpfen, sind je nach wahlfreiem Lastprofil sechs bis neun SATA-SSDs nötig. Seite 22 (33) © Fujitsu Technology Solutions 2011 WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 RAID 10 mit zwölf SATA-SSDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des SATASSD-Verbandes für RAID 10 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Am leistungsfähigsten sind hier der LSI2008- und der LSI2108-Controller. Der erste hat einen geringen Vorsprung beim Lastprofil „File copy“, und der zweite einen leichten Vorsprung beim Lastprofil „File server“ und einen großen Vorsprung beim Lastprofil „Database“. Maximale Transaktionsraten, wahlfreier Zugriff, RAID 10, 12 SATA-SSDs Transaction rate [IO/s] 45000 40000 35000 30000 25000 20000 LSI2108 LSI1078 LSI2008 LSI2108 LSI1078 LSI2008 LSI2108 5000 LSI1078 10000 LSI2008 15000 0 File copy © Fujitsu Technology Solutions 2011 File server Database Seite 23 (33) WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 Sequentielle Zugriffe Bei der Betrachtung der sequentiellen Zugriffe für größere Anzahlen von Festplatten braucht nicht zwischen HDDs und SATA-SSDs unterschieden zu werden, da die jeweiligen Grenzwerte noch in einer ähnlichen Größenordnung liegen. Im Folgenden werden anhand von Messungen mit bis zu zwölf SAS-2.0-HDDs allgemeingültige Aussagen über die Controller zusammengestellt. Für andere Festplattentypen und -anzahlen kann man sich die zu erwartenden maximale Durchsätze hieraus durch geeignete Multiplikation errechnen. Wenn der so errechnete Durchsatz den Grenzwert des Controllers übersteigt, wird der Controller-Grenzwert wirksam. RAID 0 mit bis zu zwölf SAS-2.0-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Durchsätze des Festplattenverbandes für RAID 0 bei sequentiellen Lastprofilen dar. Wie bereits zuvor erwähnt, wurde der LSI1068-Controller mit acht Festplatten betrieben. Die beiden Säulengruppen in der Grafik zeigen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße). Um die Controller mit und ohne Cache fair zu vergleichen, beruhen die Werte für die Controller mit Cache (LSI1078 und LSI2108) in dieser Grafik auf folgenden Änderungen gegenüber den Standardeinstellungen des Modus„ „Performance“ von ServerView RAID: Read Mode von „Read Ahead” nach „No read ahead“ Write Mode von „Always write back” nach „Write through“ Hierdurch wird für RAID 0 beim sequentiellen Schreiben ein höherer Durchsatz ermöglicht. Beim sequentiellen Lesen wird hierdurch nichts verändert. Daher sind diese geänderten Einstellungen für RAID 0Verbände bei sequentiellen Lastprofilen generell empfehlenswert. Maximale Durchsätze, sequentieller Zugriff, RAID 0, bis zu 12 SAS-2.0-HDDs * = 8 HDDs 2000 Throughput [MB/s] 1800 PCIe 2.0-x4 1600 1400 1200 1000 PCIe 1.0-x4 800 LSI2108 LSI1078 LSI2008 LSI1068 * LSI2108 LSI1078 200 LSI2008 400 LSI1068 * 600 0 Streaming Restore Üblicherweise werden die internen RAID-Controller in einem Steckplatz für PCIe 2.0-x4 betrieben, und es sind damit Durchsätze bis zu der grau gestrichelten waagerechten Linie möglich. Man erkennt, dass die PCIe-Schnittstelle so abgestimmt ist, dass selbst in dieser maximalen Konfiguration die Möglichkeiten der HDDs praktisch voll nutzbar sind. Würde man die beiden neueren Controller (LSI2008 und LSI208) in einem Steckplatz für PCIe 2.0-x8 betreiben, würden diese nur einen minimal höheren Durchsatz erreichen (siehe Länge der Säulen über der grau gestrichelten Linie). Damit erreichen diese Controller annähernd den Durchsatz, der von den HDDs her möglich ist (der maximale Lese-/Schreibdurchsatz einer solchen SAS-2.0HDD ist 155 MB/s, d. h. der RAID-Verband könnte maximal 155 MB/s × 12 = 1860 MB/s schaffen). Die Controller der Vorgängergeneration (LSI1068, LSI1078) erreichen ca. 860 MB/s und nutzen damit die Möglichkeiten ihrer PCIe-Schnittstelle vollständig aus (PCIe 1.0, x4, schwarze gestrichelte waagerechte Linie). Seite 24 (33) © Fujitsu Technology Solutions 2011 WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 RAID 10 mit zwölf SAS-2.0-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Durchsätze des Festplattenverbandes für RAID 10 bei sequentiellen Lastprofilen dar. Die beiden Säulengruppen in der Grafik zeigen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße). Maximale Durchsätze, sequentieller Zugriff, RAID 10, 12 SAS-2.0-HDDs 1200 Throughput [MB/s] 1100 1000 900 PCIe1.0-x4 800 700 600 500 400 LSI2108 LSI1078 LSI2008 LSI2108 100 LSI1078 200 LSI2008 300 0 Streaming Restore Beim sequentiellen Lesen und Schreiben erreichen oder übertreffen der LSI2008- und der LSI2108Controller den erwarteten Durchsatz von 930 MB/s (= 155 MB/s × 6). Der LSI1078-Controller erreicht beim sequentiellen Lesen 840 MB/s; also etwa den Durchsatz, den ihm seine PCIe-Schnittstelle erlaubt (gestrichelte Linie „PCIe 1.0-x4“ in der Grafik). Beim sequentiellen Schreiben mit diesem Controller bei RAID 10 kann der Durchsatz nicht über 471 MB/s erhöht werden, auch nicht mit einer geänderten Cache-Einstellung. © Fujitsu Technology Solutions 2011 Seite 25 (33) WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 RAID 5 Bei den RAID-Levels 0, 1 und 10 kann sich der Controller darauf beschränken, die logische Position der Datenblöcke einer physikalischen Position im RAID-Verband zuzuordnen („Striping“) und ggf. ganze Blöcke gespiegelt zu schreiben („Mirroring“). Demgegenüber muss ein Controller bei RAID-Levels wie RAID 5 erheblich höhere Anforderungen bewältigen, und zwar hauptsächlich beim Schreiben. Das liegt daran, dass solche RAID-Levels zusätzliche Blöcke mit Paritätsdaten benötigen, die aus den eigentlichen Daten erst berechnet werden müssen. Die Messungen dieses Unterkapitels wurden mit dem LSI1078- und dem LSI2108-Controller durchgeführt, da nur sie standardmäßig RAID 5 unterstützen. Da speziell die Grenzwerte bei höherem PerformanceBedarf interessieren, werden zur Verdeutlichung Messungen mit zwölf leistungsfähigen SAS-2.0-HDDs oder SATA-SSDs benutzt. Diese Festplatten sind im Kapitel „Messumgebung“ näher beschrieben. Wahlfreie Zugriffe Transaction rate [IO/s] Bei RAID 5 wird aus einem Schreibauftrag des Anwendungsszenarios eine spezifisch erhöhte Anzahl von Zugriffen auf den RAID-Verband erzeugt. Das wirkt sich besonders bei wahlfreien Zugriffen aus. Dadurch bedingt sinkt die maximal mögliche Transaktionsrate aus Sicht der Anwendung auf einen bestimmten Prozentsatz, wenn man dieselbe Menge an Festplatten zuerst als RAID 0, und danach als RAID 5 konfiguriert. Diese Prozentsätze sind in erster Näherung spezifisch für den Vergleich mit RAID 5 und das verwendete wahlfreie Lastprofil, hängen aber auch vom Controller ab. Die folgende Grafik stellt die maximalen gemessenen Transaktionsraten für einen Verband aus zwölf SAS2.0-HDDs dar, der einmal als RAID 0 und dann als RAID 5 konfiguriert wurde, beide Male in Verbindung mit dem LSI2108-Controller. Die Werte Vergleich VergleichRAID RAID00und undRAID RAID5,5,wahlfreier wahlfreierZugriff, Zugriff, für RAID 0 sind annähernd das 12 12SAS-2.0-HDDs SAS-2.0-HDDs technische Maximum für diesen HDD-Verband. Die drei Säulen8000 gruppen in der Grafik stellen die RAID 0 × 55% 7000 Transaktionsraten für die StandardRAID 5 lastprofile „File copy“ (wahlfreier 6000 Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% 5000 read, 64 kB Blockgröße) und × 59% × 48% 4000 „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße) dar. Für jedes 3000 dieser drei Lastprofile ist der 2000 gemessene Wert für RAID 5 ein bestimmter Prozentsatz des Wertes 1000 für RAID 0. Diese vergleichenden 0 Prozentsätze sind über den Pfeilen in der Grafik eingetragen. File copy File Server Database Für das Lastprofil mit 50% Schreibanteil („File copy“) ermöglicht der LSI2108-Controller einen vergleichenden Prozentsatz von 48%; für die Lastprofile mit einem Schreibanteil von 33% („File server“ und „Database“) ermöglicht er vergleichende Prozentsätze von 59% bzw. 55%. Mit einer Abschätzung auf Basis von Vervielfachungsfaktoren für die Schreibaufträge könnte man herleiten, dass dieser vergleichende Prozentsatz im ersten Fall theoretisch 40% betragen müssten, und in den beiden anderen Fällen theoretisch 50%. Die mit dem LSI2108-Controller erreichten Prozentsätze liegen also jeweils eindeutig darüber. Dies ist nur möglich aufgrund des (standardmäßig eingeschalteten) Controller-Caches. Je höher diese Prozentsätze, umso besser ist das Controller-Design. Eine ausführliche Herleitung der theoretischen Prozentsätze von 40% bzw. 50% würde hier zu weit führen. Die Grundlagen der einzelnen RAID-Levels sind ausführlich in dem Dokument „RAID-Performance“ beschrieben. Seite 26 (33) © Fujitsu Technology Solutions 2011 WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 HDDs Die bei RAID 5 erreichbaren Performance-Werte für wahlfreie Lastprofile sollen nun als erstes für den Fall von HDDs verdeutlicht werden. Wie bei den RAID-Levels 0, 1 und 10 (ohne Paritätsberechnung) ist auch für diesen RAID-Level bei HDDs im Gegensatz zu SSDs die maximale Performance des Speichermediums dominierend, daher ist eine getrennte Behandlung beider Festplattentechnologien sinnvoll. RAID 5 mit zwölf SAS-2.0-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des Festplattenverbandes für RAID 5 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen in der Grafik zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Die Transaktionsraten für den LSI2108-Controller wurden bereits etwas weiter oben bei dem Vergleich RAID 0 mit RAID 5 verwendet. Der LSI2108-Controller, also der neuere Controller mit dem größeren Cache, hat einen leichten Vorsprung. Maximale Transaktionsraten, wahlfreier Zugriff, RAID 5, 12 SAS-2.0-HDDs Transaction rate [IO/s] 4000 3500 3000 2500 2000 1500 LSI2108 LSI1078 LSI2108 LSI1078 LSI2108 500 LSI1078 1000 0 File copy © Fujitsu Technology Solutions 2011 File server Database Seite 27 (33) WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 SATA-SSDs Als nächstes sollen die mit SATA-SSDs erzielbaren Transaktionsraten diskutiert werden (nach wie vor im Falle von RAID 5 bei wahlfreien Lastprofilen). Ganz ähnlich wie bei den zuvor behandelten RAID-Levels 0 und 10 treten auch bei RAID 5 durch die Verwendung von SATA-SSDs die Unterschiede zwischen den verschiedenen Controllern deutlich hervor. Die folgende Grafik stellt die maximalen Transaktionsraten für die verschiedenen Controller am Beispiel eines Verbandes aus zwölf SATA-SSDs zusammen. Die drei Säulengruppen in der Grafik zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Maximale Transaktionsraten, wahlfreier Zugriff, RAID 5, 12 SATA-SSDs Transaction rate [IO/s] 15000 12000 9000 LSI2108 LSI1078 LSI2108 LSI1078 LSI2108 3000 LSI1078 6000 0 File copy File server Database Drückt man diese Maximalwerte in Form von SATA-SSD-Anzahlen aus, heißt das: Bei RAID 5 ermöglicht es der LSI2108-Controller – je nach wahlfreiem Lastprofil – drei bis sieben SATA-SSDs auszulasten, ohne dass ein Engpass am Controller entsteht. Diese Abschätzung beruht neben den SATA-SSD-spezifischen Grenzwerten aus dem Kapitel „Messumgebung“ auch auf den für RAID 5 gültigen Prozentsätzen für die Verminderung der maximalen Transaktionsrate vom Anfang des aktuellen Unterkapitels „Wahlfreie Zugriffe“. Die Unterschiede zwischen den beiden Controller-Generationen wären auch schon bei drei SATA-SSDs deutlich erkennbar, daher ist im betrachteten Fall zum Erreichen optimaler Performance der LSI2108Controller zu empfehlen. Seite 28 (33) © Fujitsu Technology Solutions 2011 WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 Sequentielle Zugriffe Auch bei RAID 5 braucht bei der Betrachtung der sequentiellen Zugriffe für größere Anzahlen von Festplatten nicht zwischen HDDs und SATA-SSDs unterschieden zu werden, da die jeweiligen Grenzwerte noch in einer ähnlichen Größenordnung liegen. Im Folgenden werden anhand von Messungen mit zwölf SAS-2.0-HDDs allgemeingültige Aussagen über die Controller zusammengestellt. Die zu erwartenden maximale Durchsätze lassen sich auf andere Festplattentypen und -anzahlen umrechnen. Wenn der zu erwartende Durchsatz den Grenzwert des Controllers übersteigt, wird der Controller-Grenzwert wirksam. Im Falle von RAID 5 befinden sich in einer logisch zusammengehörigen Gruppe von Blöcken in einem Verband aus N Festplatten immer (N-1) Blöcke mit den eigentlichen Daten und 1 Block mit Paritätsdaten. Bei einer vollständigen sequentiellen Bearbeitung einer solchen Gruppe enthält also immer ein Anteil von 1/(N-1) die Paritätsdaten. Demnach kann eine solche sequentielle Bearbeitung nie mehr als den (N-1)-fachen Datendurchsatz einer einzelnen Festplatte für die Anwendung bereitstellen. Die beiden nächsten Grafiken zeigen die Controller in sequentiellen Anwendungsszenarien mit verschieden großen RAID 5-Verbänden aus SAS-2.0-HDDs. RAID 5 mit drei SAS-2.0-HDDs Die beiden Säulengruppen in der Grafik zeigen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße). Im Falle der drei HDDs kann in allen Fällen annähernd der erwartete zweifache Maximaldurchsatz des verwendeten HDD-Typs erreicht werden (155 MB/s × 2 = 310 MB/s). Bei dieser geringen Festplattenanzahl ist noch kein nennenswerter Unterschied zwischen den Controllern vorhanden. Maximale Durchsätze, sequentieller Zugriff, RAID 5, 3 SAS-2.0-HDDs Throughput [MB/s] 400 300 200 LSI2108 LSI1078 LSI2108 LSI1078 100 0 Streaming © Fujitsu Technology Solutions 2011 Restore Seite 29 (33) WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 RAID 5 mit zwölf SAS-2.0-HDDs Im Falle der zwölf HDDs zeigt sich wieder der Grenzwert des LSI1078-Controllers. Der LSI2108-Controller erreicht beim Lesen 1611 MB/s, also fast den hier maximal möglichen Durchsatz von 1705 MB/s (= 155 MB/s × 11). Der LSI1078-Controller erlaubt beim Lesen maximal 858 MB/s und nutzt damit die Möglichkeiten der PCIe 1.0-x4-Schnittstelle optimal aus (gestrichelte Linie „PCIe 1.0-x4“ in der Grafik). Beim sequentiellen Schreiben für diesen RAID-Level erreicht der LSI1078-Controller einen maximalen Durchsatz von etwa 400 MB/s, und der LSI2108-Controller von etwa 1200 MB/s. Streaming LSI2108 LSI1078 PCIe1.0-x4 LSI2108 1700 1600 1500 1400 1300 1200 1100 1000 900 800 700 600 500 400 300 200 100 0 LSI1078 Throughput [MB/s] Maximale Durchsätze, sequentieller Zugriff, RAID 5, 12 SAS-2.0-HDDs Restore Für Festplattenanzahlen N zwischen drei und zwölf kann man die zu erwartenden Durchsatzwerte für die hier betrachteten sequentiellen Lastprofile wie bereits erwähnt abschätzen als das (N-1)-Fache des Durchsatzes einer einzelnen Festplatte. Grenzwerte der Controller können dabei nicht übertroffen werden. Seite 30 (33) © Fujitsu Technology Solutions 2011 WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 Geringere Lastniveaus Die Unterschiede zwischen den Controllern zeigen sich nicht nur in den erreichbaren Maximalwerten bei hoher Belastung, sondern auch schon bei geringerer Belastung. Die folgende Tabelle stellt daher für die einzelnen Controller die Grenzen für die sequentiellen Durchsätze einer einzelnen Anwendung zusammen, die bei ihren Zugriffen ohne Parallelität arbeitet (im weiteren Verlauf mit „1 Outstanding IO“ bezeichnet). Diese Grenzwerte gelten für alle RAID-Level, die von den Controllern unterstützt werden, und können nicht überschritten werden. Bei RAID 0 können diese Durchsätze erreicht werden; bei anderen RAID-Levels bleiben die Durchsätze meist darunter. Controller Grenzen des sequentiellen Durchsatzes, 1 Outstanding IO, 64 kB Blockgröße 100% Lesen (Lastprofil „Streaming“) 100% Schreiben (Lastprofil „Restore“) LSI1068 230 MB/s 180 MB/s LSI2008 310 MB/s 340 MB/s LSI1078 290 MB/s 250 MB/s LSI2108 670 MB/s 670 MB/s Die Unterschiede zwischen den Controllern werden dann bedeutsam, wenn der verwendete RAID-Verband groß genug ist, um mehr als 300 MB/s sequentiellen Durchsatz für „1 Outstanding IO“ zu ermöglichen. In solchen Fällen kann ein unpassend ausgewählter Controller als Einschränkung wirken. Das folgende Beispiel illustriert dies anhand von Durchsatzmessungen bei einem RAID 5-Verband aus drei SAS-2.0-HDDs für das Lastprofil „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße). Verglichen werden der LSI1078- und der LSI2108-Controller bei verschiedenen Anzahlen von parallelen Zugriffen („Outstanding IO“). Lastprofil Restore, RAID 5, 3 SAS-2.0-HDDs, bei verschiedenen Belastungsintensitäten Throughput [MB/s] 350 300 250 200 150 100 50 0 1 2 4 8 LSI1078 175 284 301 300 LSI2108 305 305 304 305 Outstanding IO Man erkennt deutlich, dass in diesem Fall der LSI1078-Controller für 1 und 2 Outstanding IOs nicht denselben Durchsatz erreicht wie der LSI2108-Controller. Letzterer erreicht schon für 1 Outstanding IO den maximalen Durchsatz des RAID 5-Verbandes (hier das Zweifache des Durchsatzes der verwendeten SAS2.0-Festplatte, also 155 MB/s × 2 = 310 MB/s), während der LSI1078-Controller nur etwas mehr als die Hälfte davon erreicht. Aus dem Blickwinkel der Antwortzeiten hieße das: Für geringe Belastungsintensitäten bei sequentiellen Zugriffen kann man mit dem LSI2108-Controller im Vergleich zum LSI1078-Controller die Antwortzeiten etwa halbieren. © Fujitsu Technology Solutions 2011 Seite 31 (33) WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 Fazit Mit dem „Modular RAID“ Konzept bieten die PRIMERGY Server eine Fülle von Möglichkeiten, um den Anforderungen verschiedener Anwendungsszenarien gerecht zu werden. Ein Onboard-Controller ist eine kostengünstige Einstiegsalternative für die RAID-Levels 0, 1 und 10, die einen PCIe-Steckplatz spart, aber auf vier SATA-Festplatten beschränkt ist. Der anteilige Konsum von Prozessorleistung des Servers fällt bei neueren Servern immer weniger ins Gewicht. Die „SAS 0/1“-RAID-Controller ohne Controller-Cache unterstützen die Basis-RAID-Lösungen RAID 0, RAID 1 und RAID 1E bzw. RAID 10 an, und liefern bei diesen RAID-Levels eine gute Performance. Im High-End-Bereich bieten die „SAS 5/6“-RAID-Controller alle heute gängige RAID-Lösungen RAID 0, RAID 1, RAID 5, RAID 6, RAID 10, RAID 50 und RAID 60 an. Diese Controller haben einen Controller-Cache und können optional mit einer BBU gesichert werden. Vielfältige Möglichkeiten, die Nutzung des Caches einzustellen, erlauben eine flexible Anpassung der Controller-Leistung an den verwendeten RAID-Level. In vielen Anwendungsszenarien, beispielsweise wenn wahlfreie Zugriffe auf konventionellen Festplatten mit hoher Belastungsintensität stattfinden, ermöglichen diese Controller eine um 30% höhere Transaktionsrate als die „SAS 0/1“-RAID-Controller. Beim Einsatz von PRIMERGY Servern mit internen Festplatten sind mit dem Aufkommen der Technologien SAS-2.0 und PCIe 2.0 sowie mit dem zunehmenden Einsatz von Solid State Disks (SSDs) auch die Anforderungen an die RAID-Controller gewachsen, daher empfiehlt sich in diesem Fall ein Controller der SAS-2.0-Generation (6G-Variante). Die Mehrzahl der Anwendungsszenarien, die das Disk-Subsystem beanspruchen, sind mit einem wahlfreien Schreib-/Lesezugriff verbunden. Wenn zur Bewältigung sehr hoher IO-Raten SSDs verwendet werden, hat der Controller einen erheblichen Einfluss auf die maximale Transaktionsrate. So kann beispielsweise bei einem RAID 5-Verband aus drei SSDs und datenbanktypischen Zugriffen die Verwendung des Controllers „RAID Ctrl SAS 6G 5/6 512 MB“ (LSI2108) anstelle eines Controllers der Vorgängergeneration eine Verdoppelung der maximalen Transaktionsrate bewirken. In Anwendungsfällen mit sequentiellem Lesezugriff sind nicht nur mit SSDs, sondern auch bereits mit etwa sechs aktuellen SAS-2.0-Festplattenlaufwerken Durchsätze von 900 MB/s und mehr möglich. Ohne die neue Generation der PCIe 2.0-fähigen Controller würde hier bei etwa 850 MB/s die Begrenzung von PCIe 1.0 mit x4-Anschluss wirksam. Ein weiterer Aspekt der schnelleren Controller bei sequentiellen Zugriffsprofilen ist der erhöhte Durchsatz bereits bei geringer Parallelität der Zugriffe. Sofern der RAID-Verband leistungsfähig genug ist, bedeutet dies in diesem speziellen Anwendungsfall, dass beim Lesen und beim Schreiben über 600 MB/s möglich sind. Für diese Spezialfälle bedeutet das mehr als eine Verdoppelung der maximalen Durchsätze gegenüber den Controllern der Vorgängergeneration. Zur Konfiguration von Controllern und Festplatten empfiehlt sich die für aktuelle PRIMERGY Server mitgelieferte RAID-Manager-Software „ServerView RAID“. Dieses Dienstprogramm ermöglicht Controllerunabhängig für die Mehrzahl der Anwendungsszenarien eine komfortable Anpassung der Controller- und Festplatteneinstellungen an die kundenseitigen Erfordernisse bezüglich Performance und Datensicherheit. Bei Verwendung von BBUs und USVen als Puffer bei Stromausfällen lässt sich die maximale Performance mit Datensicherheit vereinbaren. Seite 32 (33) © Fujitsu Technology Solutions 2011 WHITE PAPER RAID-CONTROLLER-PERFORMANCE VERSION: 1.0A 2011-09-07 Literatur PRIMERGY Systeme http://de.fujitsu.com/primergy PRIMERGY Performance http://de.fujitsu.com/products/standard_servers/primergy_bov.html Grundlagen Disk-I/O-Performance http://docs.ts.fujitsu.com/dl.aspx?id=3d4fbad8-2a7e-465f-b9ee-d43b711f636d Performance einzelner Festplatten http://docs.ts.fujitsu.com/dl.aspx?id=664c076d-f57b-4dcc-beeb-c40451554d92 RAID-Performance http://docs.ts.fujitsu.com/dl.aspx?id=146e8bf9-0431-4a33-a8cc-59588050e528 Informationen über Iometer http://www.iometer.org Kontakt FUJITSU Technology Solutions Website: http://de.fujitsu.com/ PRIMERGY Product Marketing mailto:[email protected] PRIMERGY Performance und Benchmarks mailto:[email protected] Alle Rechte vorbehalten, insbesondere gewerbliche Schutzrechte. Änderung von technischen Daten sowie Lieferbarkeit vorbehalten. Haftung oder Garantie für Vollständigkeit, Aktualität und Richtigkeit der angegebenen Daten und Abbildungen ausgeschlossen. Wiedergegebene Bezeichnungen können Marken und/oder Urheberrechte sein, deren Benutzung durch Dritte für eigene Zwecke die Rechte der Inhaber verletzen kann. Weitere Einzelheiten unter http://de.fujitsu.com/terms_of_use.html 2011-09-07 WW DE © Fujitsu Technology Solutions 2011 Copyright © Fujitsu Technology Solutions GmbH 2011 Seite 33 (33)