RAID-Controller Performance 2013
Transcription
RAID-Controller Performance 2013
White Paper RAID-Controller Performance 2013 White Paper Fujitsu PRIMERGY Server RAID-Controller Performance 2013 Diese technische Dokumentation richtet sich an Personen, die sich mit der Disk-I/OPerformance von Fujitsu PRIMERGY Servern beschäftigen. Das Dokument soll helfen, aus dem Performance-Blickwinkel die Möglichkeiten und Anwendungsgebiete der verschiedenen RAID-Controller für interne Disk-Subsysteme kennenzulernen. Abhängig von den Anforderungen an Datensicherheit und Performance sowie geplanter oder vorhandener Server-Konfiguration ergeben sich Empfehlungen für die Auswahl und Parametrisierung der Controller. Betrachtet werden Controller, die im Jahre 2013 für PRIMERGY Systeme verfügbar sind. Version 2.0a 2013-08-01 http://www.fujitsu.com/de/primergy Seite 1 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Inhalt Dokumenthistorie ................................................................................................................................................ 2 Einführung .......................................................................................................................................................... 3 RAID-Controller für PRIMERGY: Grundlagen .................................................................................................... 4 Vorstellung der RAID-Controller ..................................................................................................................... 4 Controller-Schnittstellen und ihre Durchsatzgrenzen ..................................................................................... 7 Sicherung des Controller-Caches gegen Stromausfall ................................................................................. 10 Performance-relevante Einstellungen ........................................................................................................... 11 MegaRAID Advanced Software Options ....................................................................................................... 13 Besonderheiten der Onboard-Controller ....................................................................................................... 14 Messumfeld ...................................................................................................................................................... 15 Messverfahren .............................................................................................................................................. 15 Messumgebung ............................................................................................................................................. 16 Controller-Vergleich .......................................................................................................................................... 18 RAID 1 (zwei SATA-Festplatten) .................................................................................................................. 19 RAID 1 (zwei SAS-Festplatten) ..................................................................................................................... 21 RAID 0 und 10 (vier SATA-Festplatten) ........................................................................................................ 24 RAID 0 und 10 (fünf bis acht Festplatten) ..................................................................................................... 27 RAID 0 und 10 (mehr als acht Festplatten)................................................................................................... 35 RAID 5 ........................................................................................................................................................... 42 Geringere Lastniveaus .................................................................................................................................. 46 MegaRAID Advanced Software Options .......................................................................................................... 47 CacheCade 2.0 ............................................................................................................................................. 47 FastPath ........................................................................................................................................................ 50 Fazit .................................................................................................................................................................. 52 Literatur ............................................................................................................................................................. 54 Kontakt .............................................................................................................................................................. 54 Dokumenthistorie Version 1.0 Version 1.0a kleinere Korrekturen Version 2.0 Anpassung des Dokumententitels an 2013 Ergänzung um die im Jahre 2013 eingeführten Controller mit Unterstützung von PCIe Gen3 Ergänzung um die MegaRAID Advanced Software Options Neue Messergebnisse bei den Controller-Vergleichen für RAID 1 aufgrund geänderter Empfehlungen für die Cache-Einstellungen kleinere Korrekturen Version 2.0a kleinere Korrekturen Seite 2 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Einführung Festplatten sind sowohl besonders sicherheitsrelevante als auch Performance-kritische Komponenten im Server-Umfeld. Daher ist es wichtig, durch eine intelligente Organisierung dieser Komponenten deren Performance so zu bündeln, dass sie nicht zum Engpass im System werden, und gleichzeitig gegen den Ausfall einer Einzelkomponente gefeit zu sein. Hierfür gibt es Methoden, mehrere Festplatten in einem Verband derart zu arrangieren, dass der Ausfall einer Festplatte verkraftet werden kann. Man nennt dies „Redundant Array of Independent Disks“ oder kurz RAID. Typischerweise werden dafür spezielle RAIDController verwendet. Die verschiedenen PRIMERGY Server sind in unterschiedlichen internen Ausbauvarianten mit verschiedenen RAID-Controller- und Festplattenkonfigurationen verfügbar. Das für alle Server der PRIMERGY Familie einheitlich angebotene „Modular RAID“-Konzept besteht aus einer modularen Controller-Familie und einem einheitlichen Management durch die Fujitsu RAID-Manager-Software „ServerView RAID“. Das umfangreiche Angebot der RAID-Lösungen ermöglicht dem Anwender, den passenden Controller für sein Anwendungsszenario zu wählen. Dabei wird die Leistungsfähigkeit des DiskSubsystems durch den Controller, die Auswahl der Festplatten und die Eigenschaften des RAID-Levels bestimmt. Um alle diese Aspekte des „Modular RAID“ hinsichtlich ihrer Performance zu beleuchten, sind im Rahmen der PRIMERGY White Paper Reihe verschiedene Dokumente entstanden: Zur umfassenden Einführung in die Thematik der Disk-I/O-Performance sei das White Paper „Grundlagen Disk-I/O-Performance“ empfohlen. Das Dokument „Performance einzelner Festplatten“ stellt die aktuell für PRIMERGY verfügbaren Festplatten und ihre Leistung in unterschiedlichen Anwendungsszenarien vor. Das vorliegende Dokument „RAID-Controller-Performance 2013“ behandelt alle aktuell für PRIMERGY angebotenen RAID-Controller und deren Performance. Bei der Dimensionierung von internen Disk-Subsystemen für PRIMERGY Server kann man so vorgehen, dass man sich einen geeigneten Festplattentyp auswählt und die benötigte Festplattenanzahl für den gewünschten RAID-Level nach Faustformeln abschätzt. Der RAID-Controller ergibt sich dann von selbst durch Anzahl und Technologie der anzuschließenden Festplatten sowie durch den gewünschten RAIDLevel. Das kann jahrelang ausreichend sein, um ein Disk-Subsystem treffsicher zu dimensionieren. In Laufe der Zeit schreitet jedoch die Technologie bei den Speichermedien (beispielsweise Solid State Drives, kurz SSDs) oder bei den internen Schnittstellen des Servers fort, und das neue Disk-Subsystem genügt nicht mehr den gestiegenen Ansprüchen. Oder, in einer produktiven Server-Konfiguration ändert sich das Anwendungsszenario und die erzielte Disk-I/O-Performance ist trotz ausreichender Festplattenanzahl nicht wie erhofft. In diesen beiden Fällen kann es lohnend sein, sich etwas genauer mit dem PerformanceEinfluss des RAID-Controllers zu beschäftigen. Manchmal ist der richtige Controller, oder auch einfach der richtig konfigurierte Controller, die Voraussetzung für bestmögliche Performance. Damit ist das Ziel des vorliegenden Dokumentes umrissen. Zuerst wird ein Überblick über die für PRIMERGY Systeme zur Verfügung stehenden internen RAID-Controller gegeben. Die Durchsatzgrenzen der beteiligten Controller-Schnittstellen werden dann unter Performance-Aspekten vorgestellt. Nach einer kurzen Einführung in das Messumfeld werden die unterschiedlichen RAID-Controller bei verschiedenen RAID-Levels und in unterschiedlichen Anwendungsszenarien verglichen, was durch Messergebnisse untermauert wird. Zur Abgrenzung zu anderen Speichermedien wurde in der Vergangenheit der Begriff „Festplatte“ oder auch „Hard-Disk-Drive“ (HDD) für ein hartmagnetisch beschichtetes, rotierendes, direkt adressierbares, digitales, nichtflüchtiges Speichermedium eingeführt. Im Laufe der technischen Entwicklung wurden zusätzliche „Festplatten“-Gattungen als Speichermedien eingeführt, die die gleiche Schnittstelle zum Server verwenden und vom Server dementsprechend wie Festplatten behandelt werden. Als typisches Beispiel kann man eine SSD anführen, die als elektronisches Speichermedium keine beweglichen Teile beinhaltet, nichtsdestotrotz jedoch umgangssprachlich auch als Festplatte bezeichnet wird. In diesem Dokument wird durchgehend der Begriff „Festplatte“ als Oberbegriff verwendet, während bei einer Differenzierung die Bezeichnungen „SSD“ und „HDD“ verwendet werden. 12 In diesem Dokument sind Festplattenkapazitäten durchgängig zur Basis 10 angegeben (1 TB = 10 Bytes), während alle anderen Kapazitäten, Dateigrößen, Blockgrößen und Durchsätze zur Basis 2 angegeben sind 20 (1 MB/s = 2 Bytes/s). http://www.fujitsu.com/de/primergy Seite 3 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID-Controller für PRIMERGY: Grundlagen In diesem Kapitel werden die für PRIMERGY Server verfügbaren RAID-Controller zunächst einmal mit ihren wesentlichen Funktionalitäten vorgestellt. Anschließend wird näher auf die Durchsatzgrenzen eingegangen, die sich für die einzelnen Controller aufgrund ihrer Schnittstellen im Server ergeben. Daraufhin werden die möglichen Einstellungen der Controller behandelt, und abschließend werden die Besonderheiten der Onboard-Controller diskutiert. Vorstellung der RAID-Controller Die folgende Tabelle fasst die wichtigsten Daten zur Funktionalität der verfügbaren RAID-Controller zusammen. Zur vereinfachten Bezeichnung dieser Controller werden im vorliegenden White Paper meist nur die kurzen Namen aus der Spalte „Alias“ verwendet, also beispielsweise LSI2008. Diese ergeben sich aus der BasisChip-Bezeichnung des Controllers und optional der Cache-Größe. Controller Name Alias FF Cache Frequenz Unterstützte Interfaces Max. RAID Levels BBU/ # Disks FBU LSI SW RAID on Intel C200 (Onboard SATA) Cougar Point I - 3G SATA 3G 4 JBOD, 0, 1, 10 -/- LSI SW RAID on Intel C600 (Onboard SATA) Patsburg A I - 3G SATA 3G 4 0, 1, 10 -/- LSI SW RAID on Intel C600 (Onboard SAS) Patsburg B I - 3G SATA 3G SAS 3G 4 0, 1, 10 -/- RAID 0/1 SAS based on LSI1064 LSI MegaRAID 4Port P - 3G SATA 3G SAS 3G PCIe 1.0 x4 4 0, 1, 1E -/- RAID 0/1 SAS based on LSI1068 LSI MegaRAID 8Port P - 3G SATA 3G SAS 3G PCIe 1.0 x4 8 0, 1, 1E -/- RAID Ctrl SAS 6G 0/1 (D2607) P - 6G SATA 3G/6G PCIe 2.0 SAS 3G/6G x8 8 0, 1, 1E, 10 -/- 512 MB 6G 8 0, 1, 5, 6, 10, 50, 60 /- RAID Ctrl SAS 6G 5/6 512 MB (D2616) PY SAS RAID Mezz Card 6Gb LSI2008 P LSI2108 M SATA 3G/6G PCIe 2.0 SAS 3G/6G x8 RAID Ctrl SAS 6G 5/6 1GB (D3116) LSI2208-1G2.0 P 1 GB 6G SATA 3G/6G PCIe 2.0 SAS 3G/6G x8 8 0, 1, 1E, 5, 6, 10, 50, 60 -/ RAID Ctrl SAS 6G 5/6 1GB (D3116C) LSI2208-1G3.0 P 1 GB 6G SATA 3G/6G PCIe 3.0 SAS 3G/6G x8 8 0, 1, 1E, 5, 6, 10, 50, 60 -/ PY SAS RAID HDD 1)2) Module LSI2208-5121)2) 2.0 M 512 MB 6G SATA 3G/6G PCIe 2.0 SAS 3G/6G x8 8 0, 1, 1E, 5, 6, 2) 10, 50, 60 -/ PY SAS RAID HDD 1)2) Module 3.0 LSI2208-5121)2) 3.0 M 512 MB 6G SATA 3G/6G PCIe 3.0 SAS 3G/6G x8 8 0, 1, 1E, 5, 6, 2) 10, 50, 60 -/ PY SAS RAID HDD 1) Module w/o cache LSI2208-Lite1) 2.0 M - 6G SATA 3G/6G PCIe 2.0 SAS 3G/6G x8 8 0, 1 -/- PY SAS RAID HDD LSI2208-Lite1) 1) Module w/o cache 3.0 3.0 M - 6G SATA 3G/6G PCIe 3.0 SAS 3G/6G x8 8 0, 1 -/- 1) 2) Diese Controller sind nur für PRIMERGY BX920 S3 verfügbar. Die RAID-Levels außer 0 und 1 sind bei dem LSI2208-512 Controller nur benutzbar in Zusammenhang mit mehr Festplattensteckplätzen in PRIMERGY SX980 Storage Blades. Die Spalte „FF“ gibt den Formfaktor wieder; „I“ bedeutet „integriert“, „P“ bedeutet „PCIe-Slot“ und „M“ bedeutet „Mezzanine Karte“. Die Spalte „Max. # Disks“ gibt die maximale Anzahl Festplatten an, die direkt an dem Controller im Rahmen des RAID-Management-Konzeptes der PRIMERGY Server betrieben werden können. Diese Information kann hilfreich sein, um zu erkennen, ob der Controller einen theoretischen Engpass darstellen könnte. In einigen PRIMERGY Modellen kommen – in Verbindung mit bestimmten Controller-Modellen – sogenannte „Expander“ (spezielle im SAS-Standard definierte Bauteile) zum Einsatz, um die maximale Anzahl der Festplatten darüber hinaus zu erhöhen. Der Expander kann dabei die Seite 4 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Bandbreite der vorhandenen Ports nicht steigern, stellt sie aber in Summe allen angeschlossenen Festplatten zur Verfügung. Bei den „RAID 0/1“ SAS-RAID-Controllern ist der LSI2008-Controller der 6G-Nachfolger vom LSI1068Controller, während die LSI2208-Controller die Nachfolger des LSI2108-Controllers sind, die zusammen die „RAID 5/6“ SAS-RAID-Controller-Familie bilden. Den LSI2208-Controller gibt es mit den beiden Cache-Größen 1 GB und 512 MB, abgekürzt durch die beiden Aliasnamen LSI2208-1G und LSI2208-512. Wenn im weiteren Verlauf nur von LSI2208 die Rede ist, gilt die Aussage für beide Cache-Größen. Für die Gruppe der drei LSI2208-Controller wurde 2013 ein neuer Chip eingeführt, der PCIe Gen3 unterstützt. Zur besseren Unterscheidung in diesem Dokument wurden die Aliasnamen um die Endungen 2.0 bzw. 3.0 erweitert. Werden Aliasnamen ohne diese Endungen verwendet, gilt die Aussage für beide Controller-Varianten. http://www.fujitsu.com/de/primergy Seite 5 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Bei der Beurteilung der Leistungsfähigkeit von Disk-Subsystemen spielen bei heutigen Systemen die Prozessorleistung und der Speicherausbau des Systems meist keine signifikante Rolle – ein eventuell vorhandener Engpass betrifft in der Regel die Festplatten und den RAID-Controller und nicht CPU oder Memory des Server-Systems. Daher können die verschiedenen RAID-Controller unabhängig von den PRIMERGY Modellen verglichen werden, in denen sie eingesetzt werden, auch wenn nicht bei allen PRIMERGYs aufgrund ihrer Ausbaubarkeit mit Festplatten alle Konfigurationen möglich sind. In der folgenden Tabelle ist zusammengestellt, welche RAID-Controller zum Zeitpunkt der Erstellung dieses White Papers in den einzelnen PRIMERGY Systemen für den Anschluss von Festplatten freigegeben sind oder in naher Zukunft freigegeben werden (oder in der Vergangenheit freigegeben waren) und wie viele Festplatten die Modelle maximal unterstützen. Die möglichen Kombinationen von PRIMERGY Ausbauvarianten und Controllern entnehmen Sie bitte den Konfiguratoren zu den Systemen. LSI2008 LSI1068 LSI2208-Lite -/ LSI2208-512 LSI2208-1GB -/ -/ LSI2108 LSI1064 CougarPoint -/ -/ Patsburg B 2 2 8 24 4 4 8 16 24 8 8 8 4 10 4 4 4 4 8 8 24 Controller mit PCIe-Schnittstelle Patsburg A BX920 S3 BX924 S3 CX250 S1 CX270 S1 RX100 S7 RX100 S7p RX200 S7 RX300 S7 RX350 S7 RX500 S7 RX600 S6 RX900 S2 SX940 S1 SX960 S1 TX100 S3 TX100 S3p TX120 S3 TX120 S3p TX140 S1 TX140 S1p TX300 S7 Expander PRIMERGY Max. # Disks Onboard-Controller Bei dem Server Blade BX924 S3 ist der LSI2108-Controller als Mezzanine-Karte realisiert. Entsprechend gilt dies bei dem Server Blade BX920 S3 für die LSI2208-Controller. Das vorliegende White Paper untersucht die zuvor genannten Mezzanine-Karten nur in Zusammenhang mit internen Festplatten im selben Server Blade. Die Performance von Storage Blades PRIMERGY SX980, die mit solchen Mezzanine-Karten über SAS-Switche verbunden sind, wird in dem Performance Report der PRIMERGY SX980 behandelt. Seite 6 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Controller-Schnittstellen und ihre Durchsatzgrenzen Ein RAID-Controller braucht einerseits eine Schnittstelle zu den Festplatten und andererseits zum Chipsatz des Motherboards. Die erste ist typischerweise SAS oder SATA, die zweite ist typischerweise PCIe oder, im Falle der integrierten Onboard-Controller, eine interne Busschnittstelle des Motherboards. Im Folgenden sind die oberen Grenzen für die Durchsätze von SAS, SATA und PCIe zusammengestellt. SAS und SATA „Serial Attached SCSI“ (SAS) und „Serial Advanced Technology Attachment“ (SATA) sind serielle Schnittstellen, deren Datendurchsatz von der Frequenz abhängt. Diese Schnittstellen dienen zum Anschluss nichtflüchtiger Speichermedien wie Festplatten, optischen Laufwerken und Bandlaufwerken. 3000 MHz Theoretischer Durchsatz 286 MB/s Praktischer Durchsatz (85%) 243 MB/s 6000 MHz 572 MB/s 486 MB/s Typ Frequenz SAS 3G / SATA 3G SAS 6G / SATA 6G Man findet die Frequenzen in der Abkürzung 3G oder 6G oft als Teil der Controller- oder Festplattenbezeichnung, alternativ wird bei SAS auch eine Versionsnummer 1.0 für 3G und 2.0 für 6G verwendet. Der theoretisch erreichbare Durchsatz errechnet sich folgendermaßen: 1 Bit pro 1 Hz, minus 20% Redundanz der seriellen Übertragung durch die sogenannte 8b/10b-Kodierung. Den in der Praxis erreichbaren Durchsatz kann man daraus durch Multiplikation mit 0.85 abschätzen. Diese 85% sind ein durchschnittlicher Erfahrungswert aus über die Jahre hinweg beobachteten Werten für verschiedenste Komponenten. Alle Komponenten einer Verbindung zwischen Endgeräten müssen dieselbe Version des SAS- oder SATAProtokolls verwenden. Dazu zählen neben den Festplatten auch die Controller und ggf. verwendete Expander. Treffen unterschiedliche Komponenten aufeinander, wird automatisch der performanteste von allen Komponenten gemeinsam unterstützte Standard verwendet, eventuell also eine geringere Frequenz. Dabei sind die höheren Protokolle abwärtskompatibel. Während bei SATA oft jeder Port einzeln an eine Festplatte angeschlossen wird, werden vier SASAnschlüsse bzw. -Leitungen häufig zusammengefasst und als „x4 SAS“ oder „x4 wide port“ bezeichnet. Damit ist der direkte Anschluss von maximal vier SAS-Festplatten über eine Backplane möglich. Der Durchsatz von x4 SAS ist der Vierfache des entsprechenden einzelnen SAS-Anschlusses, dies gilt analog auch für SATA. 3000 MHz Theoretischer Durchsatz 1144 MB/s Praktischer Durchsatz (85%) 973 MB/s 3000 MHz 2289 MB/s 1945 MB/s 1 × x4 6000 MHz 2289 MB/s 1945 MB/s 2 × x4 6000 MHz 4578 MB/s 3890 MB/s Schnittstelle Anschluss Frequenz SAS 3G / SATA 3G 1 × x4 SAS 3G / SATA 3G 2 × x4 SAS 6G / SATA 6G SAS 6G / SATA 6G Einige PRIMERGY Modelle kann man mit einer größeren Anzahl Festplatten ausbauen, als der Controller Festplattenanschlüsse hat. In diesem Fall wird die Anzahl der anschließbaren Festplatten mittels eines Expanders vergrößert. Wie bereits erwähnt, kann ein Expander den Datenstrom nur verteilen, nicht den Durchsatz erhöhen. Das SAS-Protokoll ist so definiert, dass es auch die SATA-Protokolle gleicher oder geringerer Frequenz transportieren kann (tunneln). Damit ist es Controllern beider SAS-Versionen möglich, mit SATA-Festplatten zu kommunizieren. Umgekehrt ist es nicht möglich, SAS-Festplatten über eine SATA-Schnittstelle anzuschließen. http://www.fujitsu.com/de/primergy Seite 7 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 PCIe PCIe ist eine ebenfalls serielle Schnittstelle zwischen dem Controller und dem Motherboard. Die Steckverbindungen sind in unterschiedlicher Breite bzw. Anzahl von Lanes ausgeführt. Üblich sind x4 (vier Lanes) und x8 (acht Lanes), wobei es auf die tatsächliche Anzahl elektrisch genutzter Lanes ankommt (im weiteren Verlauf als „funktionelle PCIe Breite“ bezeichnet). Der Durchsatz einer Lane wird ebenfalls durch die Frequenz bestimmt. Schnittstelle PCIe 1.0, PCIe Gen1 Anschluss x4 Frequenz 2500 MHz Theoretischer Durchsatz 954 MB/s Praktischer Durchsatz (90%) 858 MB/s PCIe 1.0, PCIe Gen1 x8 2500 MHz 1907 MB/s 1716 MB/s PCIe 2.0, PCIe Gen2 x4 5000 MHz 1907 MB/s 1716 MB/s PCIe 2.0, PCIe Gen2 x8 5000 MHz 3815 MB/s 3433 MB/s PCIe 3.0, PCIe Gen3 x4 8000 MHz 3756 MB/s 3380 MB/s PCIe 3.0, PCIe Gen3 x8 8000 MHz 7512 MB/s 6761 MB/s PCIe 1.0 wird auch oft als „PCIe Gen1“ bezeichnet, PCIe 2.0 als „PCIe Gen2“ und PCIe 3.0 als „PCIe Gen3“. Der theoretisch erreichbare Durchsatz errechnet sich folgendermaßen: 1 Bit pro 1 Hz multipliziert mit der Anzahl der Anschlüsse (x4 oder x8), minus 20% Redundanz der seriellen Übertragung durch die sogenannte 8b/10b-Kodierung bei PCIe 1.0 und 2.0 bzw. minus 1.54% Redundanz durch eine 128b/130b-Kodierung bei PCIe 3.0. Den in der Praxis erreichbaren Durchsatz kann man daraus durch Multiplikation mit 0.90 abschätzen. Diese 90% sind ein durchschnittlicher Erfahrungswert aus über die Jahre hinweg beobachteten Werten für verschiedenste Komponenten. Alle PRIMERGY Server beginnend mit der 2010 eingeführten Generation (z. B. PRIMERGY RX300 S5) unterstützen PCIe 2.0 und ab der 2012 eingeführten Generation (z. B. PRIMERGY RX300 S7) PCIe 3.0. Treffen unterschiedliche Komponenten aufeinander, wird die höchste von allen Komponenten gemeinsam unterstützte Frequenz verwendet. Seite 8 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Anwendung auf die RAID-Controller In der nächsten Tabelle sind für alle RAID-Controller die Performance-bestimmenden Rahmendaten zusammengestellt. Die hier aufgeführten Durchsatzgrenzen ergeben sich mit Hilfe der beiden vorhergehenden Unterkapitel „SAS und SATA“ sowie „PCIe“. Die jeweils maßgebliche Durchsatzgrenze ist in der Tabelle mit Fettdruck hervorgehoben. ControllerAlias # CPU Cores Cache Memory Typ # DiskAnschlüsse Grenze für Durchsatz Disk-Interface Cougar Point 4 × SATA 3G 973 MB/s Patsburg A 4 × SATA 3G 973 MB/s Patsburg B 4 × SAS 3G 973 MB/s Grenze für PCIeEffektive Durchsatz PCIeVersion PCIe-Breite Interface LSI1064 1 4 × SAS 3G 973 MB/s 1.0 x4 858 MB/s LSI1068 1 8 × SAS 3G 1945 MB/s 1.0 x4 858 MB/s LSI2008 1 8 × SAS 6G 3890 MB/s 2.0 x4 1716 MB/s x8 3433 MB/s LSI2108 1 DDR2 / 800 MHz 8 × SAS 6G 3890 MB/s 2.0 x4 1716 MB/s x8 3433 MB/s LSI2208-2.0 2 DDR3 / 1333 MHz 8 × SAS 6G 3890 MB/s 2.0 x4 1716 MB/s x8 3433 MB/s 2 DDR3 / 1333 MHz x4 3380 MB/s x8 6761 MB/s LSI2208-3.0 8 × SAS 6G 3890 MB/s 3890 MB/s 3.0 Für die Mehrzahl der Einsatzfälle stellen die Durchsatzgrenzen keinen Engpass dar. In der Praxis überwiegen nämlich die Anwendungsszenarien mit wahlfreiem Zugriff auf konventionelle Festplatten, in denen keine hohen Durchsätze erreicht werden. Für Anwendungsfälle mit rein sequentiellem Zugriff und der häufigen Blockgröße 64 kB ergibt sich die Limitierung im Falle von PCIe 1.0, x4, erst bei fünf konventionellen Festplatten; im Falle von PCIe 2.0, x8, tritt sie erst bei 17 konventionellen Festplatten ein. Bei sequentiellen oder wahlfreien Zugriffen auf moderne SAS-SSDs mit derselben Blockgröße ergibt sich die Limitierung im Falle von PCIe 2.0, x8, abhängig vom Schreibanteil bei neun bis 15 SSDs. Die Durchsatzwerte in der Spalte „Grenze für Durchsatz Disk-Interface“ gelten für die Gesamtheit der Verbindungen zwischen dem Controller und den Festplatten. Die Durchsätze über diese SAS-/SATASchnittstelle sind nur im Falle von RAID 0 mit den Durchsätzen aus Sicht der Applikation identisch. Bei anderen RAID-Levels ist der Durchsatz über die SAS-/SATA-Schnittstelle um einen spezifischen Faktor gegenüber dem Durchsatz aus Sicht der Applikation multipliziert. Dieser Faktor ist immer ≥ 1 und hängt vom RAID-Level und mehreren Merkmalen des Zugriffsmusters ab. Die realen Durchsatzgrenzen sind deswegen immer um den erwähnten spezifischen Faktor niedriger als die Werte in der Spalte „Grenze für Durchsatz Disk-Interface“. http://www.fujitsu.com/de/primergy Seite 9 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Sicherung des Controller-Caches gegen Stromausfall Um bei einem Stromausfall die Daten im Cache zu sichern, werden für PRIMERGY Server derzeit zwei Möglichkeiten angeboten: Battery Backup Unit (BBU) Die konventionelle Methode funktioniert mit einer Battery Backup Unit (BBU). Hier wird die Stromversorgung des flüchtigen Cache-Speichers während der Zeit eines Stromausfalls über eine wiederaufladbare Batterie (Akkumulator) gesichert. Da die Batterie eine begrenzte Kapazität hat, welche zudem aufgrund von physikalischen und chemischen Prozessen mit der Zeit abnimmt, kann sie die Versorgung des CacheSpeichers nur begrenzte Zeit gewährleisten. Diese Zeit ist nicht konstant, sondern abhängig von mehreren Einflussgrößen wie Alter der BBU, Ladestatus, Temperatur usw. Die BBU unterliegt daher einer eingeschränkten Garantie. Sobald der Strom wieder da und der Server hochgefahren ist, kann der RAID-Controller mit dem CacheSpeicherinhalt weiterarbeiten und die Daten bleiben konsistent. Flash Backup Unit (FBU) Mit der auf neuerer Technologie beruhenden Flash Backup Unit (FBU) werden die Daten bei einem Stromausfall nicht im Cache-Speicher gehalten, sondern der Inhalt des Cache-Speichers wird in einen nicht flüchtigen Flash-Speicher umkopiert. In diesem Flash-Speicher können die Daten fast beliebig lange verbleiben, so dass hier die von der BBU bekannte Haltezeit kein Problem mehr ist. Die Energie für den Kopiervorgang vom Cache-Speicher in den Flash-Speicher bei einem Stromausfall kommt aus einem SuperCap (Super Capacitor - Super Kondensator). Sobald der Strom wieder da und der Server hochgefahren ist, wird der Cache-Inhalt aus dem Flash-Speicher wieder in den Cache-Speicher zurückgeschrieben. Der RAID-Controller kann nun wieder weiterarbeiten und die Daten bleiben konsistent. Seite 10 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Performance-relevante Einstellungen Wesentlich für eine optimale Performance des RAID-Controllers ist eine richtige Parametereinstellung für den jeweiligen RAID-Verband. Abhängig vom Controller gibt es einen unterschiedlichen Vorrat an Parametern, die einstellbar sind. Zwecks einfacher und sicherer Handhabung der Einstellungen von RAIDController und Festplatten empfiehlt sich die für PRIMERGY Server mitgelieferte RAID-Manager-Software „ServerView RAID“. Üblicherweise wird man – spezifisch für den Anwendungsfall – mittels der vordefinierten Modi „Performance“ oder „Data Protection“ die kompletten Cache-Einstellungen für Controller und Festplatten en bloc vornehmen. Der Modus „Performance“ gewährleistet für die Mehrzahl der Anwendungsszenarien Performance-optimale Einstellungen. Durch den Modus „Performance“ werden vorhandene Caches von Controller und Festplatten eingeschaltet, daher sollte der Cache des RAID-Controllers in diesem Modus durch eine Battery Backup Unit (BBU) oder Flash Back Unit (FBU) vor Datenverlust bei einem Stromausfall geschützt werden. Zusätzlich sollten auch die Festplatten-Caches durch Einsatz einer unterbrechungsfreien Stromversorgung (USV) gesichert werden. In speziellen Fällen kann eine Parametereinstellung sinnvoll sein, die von den Standardsetzungen des Modus‘ „Performance“ abweicht. Falls dies sinnvoll ist, wird im entsprechenden Teil des Kapitels „ControllerVergleich“ darauf hingewiesen. Hinter den Cache-Einstellungen der „ServerView RAID“ Software verbergen sich – abhängig vom Controller – alle oder ein Teil der folgenden Einstellmöglichkeiten von RAID-Controller und Festplatten. Die ersten drei Einstellmöglichkeiten steuern den RAID-Controller, die letzte die Festplatten des RAID-Verbands. Alle Parameter sind spezifisch für jeden RAID-Verband einstellbar. Read mode Mit dem Parameter „Read mode“ kann das Cache-Verhalten beim Lesen beeinflusst werden. Es stehen die zwei Optionen „No read-ahead“ und „Read-ahead“ zur Verfügung. Bei „No read-ahead“ findet kein Caching beim Lesen statt. Bei "Read-ahead" macht der Controller dagegen Gebrauch vom Caching beim Lesen. Die Onboard-Controller (z. B. Patsburg A) lesen bei der Option „Read-ahead“ generell Blöcke im Voraus. Die PCIe-Controller mit Cache arbeiten bei dieser Option differenzierter: Die angeforderten Blöcke werden kontinuierlich daraufhin analysiert, ob ein sequentieller Lesezugriff vorliegt. Erkennt der Controller einen solchen Zugriff, so fängt er an, zusätzlich zum angeforderten Block auch die sequentiell nachfolgenden in den Cache einzulesen, um sie für die erwarteten nächsten Anforderungen bereitzuhalten. Die jetzige Option „Read-ahead“ ist also adaptiv. Hierin sind die beiden früheren Optionen „Read-ahead“ und „Adaptive“ verschmolzen. Write mode Unter dem Begriff „Write mode“ werden die Einstellmöglichkeiten des Controller-Caches zusammengefasst, die die Behandlung von Schreibaufträgen steuern. Es gibt drei Optionen, um den Write-Cache einzustellen: „Write-through“, „Write-back“ und „Always Write-back (independent of BBU state)“. Die Option „Writethrough“ garantiert, dass jeder Schreibauftrag vom Controller erst dann als erledigt zurückgemeldet wird, wenn er von der Festplatte quittiert wurde. Bei den Optionen „Write-back“ und „Always Write-back“ werden die Aufträge im Controller-Cache zwischengespeichert, der Anwendung sofort als erledigt quittiert und erst später an die Festplatte übergeben. Diese Prozedur ermöglicht eine optimale Ausnutzung der ControllerRessourcen, eine schnellere Abfolge der Schreibaufträge und damit einen höheren Durchsatz. Eventuelle Stromausfälle können durch eine optionale BBU/FBU überbrückt werden und die Integrität der Daten im Controller-Cache ist damit garantiert. Die Option „Always Write-back“ schaltet den Write-Cache permanent ein; er wird auch dann genutzt, wenn die BBU/FBU nicht einsatzbereit ist. Dagegen wird bei der Option „Write-back“ automatisch auf „Write-through“ umgeschaltet, solange der Controller-Cache nicht durch die BBU/FBU abgesichert ist. Cache mode Der Parameter „Cache Mode“, manchmal auch mit „I/O Cache“ bezeichnet, beeinflusst das Verhalten des Controller-Caches beim Lesen. Die Option „Direct“ legt fest, dass die zu lesenden Daten direkt von der Festplatte gelesen werden und auch nicht in dem Controller-Cache aufbewahrt werden. Die Alternative „Cached“ bewirkt, dass zuerst versucht wird, die Daten im Controller-Cache zu finden und den Leseauftrag damit zu befriedigen, bevor auf die Festplatte zugegriffen wird. Dabei werden alle Daten in den ControllerCache geschrieben, um für folgende Leseaufträge verfügbar zu sein. http://www.fujitsu.com/de/primergy Seite 11 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Disk cache mode Die möglichen Werte sind „enabled” und „disabled”. Das Einschalten des Festplatten-Caches bringt in den meisten Fällen eine Durchsatzsteigerung beim Schreibzugriff. Ist das System mit einer USV gesichert, so ist das Einschalten des Festplatten-Caches aus Performance-Gründen zu empfehlen. In der nächsten Tabelle ist dargestellt, welche dieser Einstellmöglichkeiten für die einzelnen Controller existieren. Controller-Alias Read mode Onboard-Controller Cougar Point Onboard-Controller Patsburg A Onboard-Controller Patsburg B Write mode Cache mode LSI1064 / LSI 1068 LSI2008 LSI2108 LSI2208-1GB LSI2208-512 LSI2208-Lite Zur Vervollständigung gibt die folgende Tabelle noch eine Zusammenstellung der Einstellungen, die derzeit in den Modi „Data Protection“ und Performance“ in ServerView RAID implementiert sind. Man beachte, dass diese vordefinierten Einstellungskombinationen bei den Controllern mit Controller-Cache auch von der Existenz einer BBU/FBU abhängen, aber unabhängig vom gewählten RAID-Level sind. ControllerAlias BBU/ FBU? Data Protection Read mode Write mode Cache mode Performance Disk cache Read mode Write mode Cache mode Disk cache Onboard-Controller Cougar Point Readahead off Readahead on Onboard-Controller Patsburg A Readahead off Readahead on Onboard-Controller Patsburg B Readahead off Readahead on LSI1064 / LSI1068 off on LSI2008 off on LSI2108 LSI2208-1GB / LSI2208-512 LSI2208-Lite Seite 12 (54) Readahead Writethrough Direct off Readahead Always Write-back Direct on Readahead Writeback Direct off Readahead Writeback Direct on Readahead Writethrough Direct off Readahead Always Write-back Direct on Readahead Writeback Direct off Readahead Writeback Direct on off on http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 MegaRAID Advanced Software Options Die MegaRAID Advanced Software Options setzen sich aus CacheCade 2.0 und FastPath zusammen. Hierbei werden zwei unterschiedliche Ansätze der Performance-Steigerung verfolgt, die es getrennt zu betrachten gilt. Die MegaRAID Advanced Software Options gibt es für den LSI2208-1GB- und LSI2208-512-Controller. Für die Aktivierung ist ein spezieller Lizenz-Key erforderlich. Obwohl die kleinste Konfiguration bei den MegaRAID Advanced Software Options zwei Festplatten verwendet, wird man typischerweise mehr Festplatten einsetzen, so dass im Falle von Blade Servern ein LSI2208-512-Controller zusammen mit PRIMERGY SX980 Storage Blades benutzt werden muss. CacheCade 2.0 CacheCade 2.0 ist eine Read- bzw. Read-/Write-Caching Software für Hot Spot Daten, die in signifikanter Weise die Zugriffszeiten bei der Nutzung von HDD-Verbänden reduziert, indem SSDs als nicht-flüchtiger, dynamischer high-performance Controller Cache Pool verwendet werden. Dies verbindet in einfacher Weise die beiden Vorteile der Festplattentypen HDD und SSD – große Kapazitäten und kurze Zugriffszeiten. Voraussetzung und Einschränkung Eine wesentliche Voraussetzung ist ein IO-Zugriffsschwerpunkt, ein sogenannter „Hot Spot“ der Applikation. Die Daten sind dabei auf einem RAID-Verband aus HDDs, auf den wahlfrei (random) zugegriffen wird. Zur Verbesserung der Zugriffszeiten sind SSDs erforderlich, die als CacheCade 2.0 Cache konfiguriert und dem HDD-RAID-Verband zugeordnet werden. Diese HDDs und SSDs müssen am gleichen Controller angeschlossen sein. Mögliche Konfigurationen des CacheCade 2.0 Caches sind RAID 0, RAID 1 und RAID 1E bis maximal 512 GB nutzbare Cache-Kapazität. Über die Parametereinstellung „write through“ bzw. „write back“ wird festgelegt, ob der Cache nur als Lese-Cache oder Schreib-/Lese-Cache verwendet wird. Beispielkonfiguration Eine typische Konfiguration für CacheCade 2.0 wäre z. B. ein HDD-Verband vom Typ RAID 0 aus vier SATA-6G-HDDs und ein SSD-Verband vom Typ RAID 1 aus zwei SAS-6G-SSDs als CacheCade 2.0 Cache. Diese Konfigurationen werden in diesem Dokument sowohl getrennt als auch in Kombination als CacheCade 2.0 näher betrachtet. FastPath FastPath ist ein High-Performance IO Accelerator für RAID-Verbände aus SSDs. Diese optimierte Version der LSI MegaRAID Technologie erlaubt eine deutliche Performance-Steigerung von Applikationen mit einer hohen IO-Last beim wahlfreien Zugriff, falls SATA-6G-SSDs oder SAS-6G-SSDs genutzt werden. Voraussetzung und Einschränkung Die Transaktionsrate von RAID-Verbänden aus hoch-performanten 6G-SSDs kann bei wahlfreiem Zugriff mit kleinen Blöcken limitiert sein, obwohl die Durchsatzgrenze von SAS-/SATA-6G bzw. PCIe noch nicht erreicht ist und eine ausreichende Anzahl SSDs zur Verfügung steht. In dem Fall ist es möglich, mit dem Einsatz von FastPath die Transaktionsrate erheblich zu steigern. Der IO-Bereich, ab dem FastPath erfolgreich eingesetzt werden kann, beginnt ab ca. 200000 IO/s pro Controller. Im Kapitel „Messumgebung“ ist für eine SAS-6G-SSD eine maximale Transaktionsrate von 14184 IO/s für den wahlfreier Zugriff mit 8 kB Blockgröße und einen Leseanteil von 67% ausgewiesen. Daraus lässt sich ableiten, dass die Begrenzung bei ca. vierzehn SSDs einsetzt. http://www.fujitsu.com/de/primergy Seite 13 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Besonderheiten der Onboard-Controller Einige PRIMERGY Modelle bieten mit einem Onboard-Controller – derzeit CougarPoint, Patsburg A oder Patsburg B – eine einfache, kostengünstige Einsteigerlösung für den Betrieb mit bis zu vier Festplatten. Mit der Unterstützung von RAID 0, RAID 1 und RAID 10 bietet ein solcher Onboard-Controller eine Reihe von gebräuchlichen RAID-Levels an und belegt keinen PCIe-Steckplatz. Alle Controller, die über die PCIe-Schnittstelle angebunden sind, werden hier nicht als Onboard-Controller behandelt, auch wenn sie auf dem Motherboard integriert sind (siehe Tabelle im Kapitel „Vorstellung der RAID-Controller“). Der Onboard-Controller ist als eine Firmware-/Treiber-basierte Software-RAID-Lösung realisiert. Sie ist typischerweise im „Southbridge“-Chip integriert, der zum Motherboard-Chipsatz gehört. Während der BootPhase werden Zugriffe auf den RAID-Verband durch die Firmware realisiert. Sobald das Betriebssystem aktiv ist, übernehmen geeignete Treiber diese Aufgabe. Der Onboard-Controller hat keinen eigenen Prozessor, sondern nutzt die CPU des Server-Systems für die RAID-Funktionalität. Der anteilige Konsum von Prozessorleistung des Servers fällt bei neueren Servern immer weniger ins Gewicht. CougarPoint Der Onboard-Controller CougarPoint ist ein reiner SATA-Controller. Er kann über das BIOS in verschiedene Modi eingestellt werden. Obwohl zur effektiven Benutzung dieses Typs von Controllern nur der Modus „RAID“ in Frage kommt, seien der Vollständigkeit halber alle Modi dieser SATA-Controller vorgestellt. Die fortgeschrittenen SATA-Features „Native Command Queuing“ (NCQ) und „hot swapping“ werden nicht in allen Fällen unterstützt. Es gibt drei Modi: RAID Aufgrund seiner Flexibilität empfehlenswerter Modus. Nur hierbei ist eine problemlose Migration einer SATA-HDD von einer Nicht-RAID- zu einer RAID-Konfiguration möglich. Alle Funktionalitäten von SATA werden unterstützt, also auch NCQ und „hot swapping“. Für die unterstützten RAID-Levels ist bei den PRIMERGY Servern eine Firmware namens „LSI Logic Embedded MegaRAID“ im Controller-BIOS integriert. Nur in diesem Modus sind RAID-Verbände bereits während der Boot-Phase möglich, und nur in diesem Modus sind Controller und Festplatten in der RAID-Manager-Software „ServerView RAID“ sichtbar und können dort verwaltet werden. Es sind spezielle Treiber notwendig. AHCI AHCI steht für „Advanced Host Controller Interface“ und ist ein herstellerübergreifender Schnittstellenstandard für SATA-Controller. NCQ und „hot swapping“ werden unterstützt. Auch für AHCI sind spezielle Treiber im Betriebssystem notwendig. IDE In dieser Betriebsart werden die SATA-Ports als solche dem Betriebssystem sichtbar gemacht. NCQ wird nicht unterstützt. Es werden entsprechende SATA-Treiber benötigt, die auf der Fujitsu „ServerStart DVD“ für verschiedene Betriebssysteme mitgeliefert werden. Patsburg A und Patsburg B Der C600-Chipset der im Jahre 2012 freigegebenen Server-Generation mit zwei und mehr Prozessorsockeln (z. B. PRIMERGY RX300 S7) hat eine völlig neue Architektur. Hierin ist erstmals ein SAS-/SATA-Controller integriert. Standardmäßig arbeitet dieser Controller im SATA-Modus (Patsburg A). Mit dem zusätzlich bestellbaren „SAS Enabling Key“ erfolgt der Upgrade auf die höherwertige SAS-/SATA-Variante (Patsburg B). Im BIOS einiger Server, die den Patsburg A/B enthalten, sind zwar Möglichkeiten zur SATA-Konfiguration vorgesehen (u. a. „AHCI“), diese beziehen sich aber im Allgemeinen ausschließlich auf die SATAAnschlüsse für optische Laufwerke und finden bei den hier behandelten RAID-Konfigurationen keine Verwendung. Seite 14 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Messumfeld Nachdem nun die unterschiedlichen Controller vorgestellt und ihre technischen Eigenschaften erläutert worden sind, wollen wir im nachfolgenden Kapitel „Controller-Vergleich“ die Controller in verschiedenen Anwendungsszenarien diskutieren und dies anhand von Messergebnissen untermauern. Daher seien zuerst das Messverfahren und die Messumgebung an dieser Stelle kurz vorgestellt. Alle Details des Messverfahrens und Grundlagen zur Disk-I/O-Performance sind im White Paper „Grundlagen Disk-I/O-Performance“ beschrieben. Messverfahren Standardmäßig werden Performance-Messungen von Disk-Subsystemen bei PRIMERGY Servern mit einem definierten Messverfahren durchgeführt, das die Festplattenzugriffe realer Anwendungsszenarien anhand von Kenndaten modelliert. Die wesentlichen Kenndaten sind: Anteil von wahlfreien Zugriffen / sequentiellen Zugriffen Anteil der Zugriffsarten Lesen / Schreiben Blockgröße (kB) Anzahl paralleler Zugriffe (# of Outstanding I/Os) Eine gegebene Wertekombination dieser Kenndaten heißt „Lastprofil“. Die folgenden fünf Standardlastprofile lassen sich typischen Anwendungsszenarien zuordnen: Standardlastprofil Zugriff Zugriffsart read write Blockgröße [kB] Anwendung File copy wahlfrei 50% 50% 64 Kopieren von Dateien File server wahlfrei 67% 33% 64 File-Server Database wahlfrei 67% 33% 8 Datenbank (Datentransfer) Mail Server Streaming sequentiell 100% 0% 64 Datenbank (Log-File), Datensicherung; Video Streaming (teilweise) Restore sequentiell 0% 100% 64 Wiederherstellen von Dateien Zur Modellierung parallel zugreifender Anwendungen mit unterschiedlicher Belastungsintensität wird die „# of Outstanding I/Os” mit 1, 3, 8 beginnend bis 512 gesteigert (ab 8 in Zweierpotenzschritten). Die Messungen des vorliegenden Dokumentes beruhen auf diesen Standardlastprofilen. Die wichtigsten Ergebnisse einer Messung sind: Throughput [MB/s] Transactions [IO/s] Latency [ms] Datendurchsatz in Megabytes pro Sekunde Transaktionsrate in I/O-Operationen pro Sekunde mittlere Antwortzeit in ms Für sequentielle Lastprofile hat sich der Datendurchsatz als übliche Messgröße durchgesetzt, während bei den wahlfreien Lastprofilen mit ihren kleinen Blockgrößen meist die Messgröße „Transaktionsrate“ verwendet wird. Datendurchsatz und Transaktionsrate sind direkt proportional zueinander und lassen sich nach der Formel Datendurchsatz [MB/s] = Transaktionsrate [IO/s] × Blockgröße [MB] Transaktionsrate [IO/s] = Datendurchsatz [MB/s] / Blockgröße [MB] ineinander überführen. http://www.fujitsu.com/de/primergy Seite 15 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Messumgebung Alle in diesem Dokument diskutierten Messergebnisse wurden mit den im Folgenden aufgelisteten Hardware- und Software-Komponenten ermittelt: System under Test (SUT) PRIMERGY RX300 S7 PRIMERGY TX300 S7 PRIMERGY TX120 S3p PRIMERGY BX920 S3 Microsoft Windows Server 2008 Enterprise x64 Edition SP2 Betriebssystem ServerView RAID Manager 5.5.2 RAID Manager Software ServerView RAID Manager 5.7.3 Initialisierung von RAIDRAID-Verbände werden vor der Messung mit einer elementaren Blockgröße von 64 kB Verbänden („Stripe Size“) initialisiert Dateisystem NTFS Messwerkzeug Iometer 2006.07.27 Messdaten Messdateien von 32 GB bei 1 – 8 Festplatten; 64 GB bei 9 – 16 Festplatten; 128 GB bei 17 oder mehr Festplatten Onboard SATA Controller Intel BD82C202 PCH, Cougar Point (in PRIMERGY TX120 S3p) „Cougar Point“ Driver-Name: megasr1.sys, Driver-Version: 15:00.0329.2012 BIOS-Version: A. 10.03031333R SATA RAID Modus Onboard SATA Controller Intel C600 Chipset (in PRIMERGY RX300 S7) „Patsburg A“ Driver-Name: megasr1.sys, Driver-Version: 15:00.0329.2012 BIOS-Version: SCU.11.03201000R Onboard SAS Controller Intel C600 Chipset (in PRIMERGY RX300 S7) „Patsburg B“ Driver-Name: megasr1.sys, Driver-Version: 15:00.0329.2012 BIOS-Version: SCU.11.03201000R SAS Enabling Key Controller Driver-Name: lsi_sas.sys, Driver-Version: 1.34.03.00 „RAID 0/1 SAS based on LSI Firmware-Version: 1.33.00.00 MegaRAID 4Port” BIOS-Version: 6.36.00.00 (LSI MegaRAID SAS 1064) Controller Driver-Name: lsi_sas.sys, Driver-Version: 1.34.03.00 „RAID 0/1 SAS based on LSI Firmware-Version: 1.33.00.00 MegaRAID 8Port” BIOS-Version: 6.36.00.00 (LSI MegaRAID SAS 1068) Controller Driver-Name: megasas2.sys, Driver-Version: 5.2.103.64 „RAID Ctrl SAS 6G 0/1” Firmware-Paket: 20.10.1-0075, Firmware-Version: 2.120.224-1451 (LSI MegaRAID SAS 2008) Controller Driver-Name: megasas2.sys, Driver-Version: 5.2.116.64 „RAID Ctrl SAS 5/6 512MB Firmware-Paket: 12.12.0-0087, Firmware-Version: 2.120.233-1471 (D2616)” Controller Cache: 512 MB (LSI MegaRAID SAS 2108) Driver-Name: megasas2.sys, Driver-Version: 5.2.116.64 Controller „RAID Ctrl SAS 6G 5/6 1GB Firmware-Paket: 23.2.1-0048, Firmware-Version: 3.152.65-1626 Controller Cache: 1 GB (D3116)” Driver-Name: megasas2.sys, Driver-Version: 6.505.5 Controller „RAID Ctrl SAS 6G 5/6 1GB Firmware-Paket: 23.9.0-0023, Firmware-Version: 3.220.75-2196 Controller Cache: 1 GB (D3116C)” Driver-Name: megasas2.sys, Driver-Version: 5.2.116.64 Controller Firmware-Paket: 23.2.1-0049, Firmware-Version: 3.152.75-1658 „PY SAS RAID HDD Controller Cache: 512 MB Module” Driver-Name: megasas2.sys, Driver-Version: 5.2.116.64 Controller „PY SAS RAID HDD Module Firmware-Paket: 23.2.1-0049, Firmware-Version: 3.152.74-1659 w/o cache” SATA-6G-HDD Seagate ST91000640NS, 2.5, 1000 GB, 7200 rpm, 6 Gb/s Modelle SAS-6G-HDD Toshiba MK1401GRRB, 2.5, 146 GB, 15000 rpm, 6 Gb/s SAS-6G-SSD Seagate ST200FM0002, 2.5, 200 GB, 6 Gb/s Seite 16 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Die für den Controller-Vergleich verwendeten Festplattenmodelle sind im Folgenden noch einmal ausführlich zusammen mit ihren grundlegenden Performance-Daten zusammengestellt, da diese für das Verständnis der mit den Controllern erzielten Performance-Werte wichtig sind. Bei den klassischen Festplatten (HDDs) wurden je eine leistungsfähige SATA-6G- und eine SAS-6G-Festplatte ausgewählt, und eine 200 GB SAS6G-SSD repräsentiert die Klasse der SSDs. Dargestellt sind jeweils die mit einer einzelnen Festplatte gemessenen Maximalwerte für die fünf Standardlastprofile im vorhergehenden Unterkapitel „Messverfahren“. In allen Fällen ist der FestplattenCache eingeschaltet, da dies fast immer die optimale Performance garantiert. Festplattentyp KurzBezeichnung (Alias) Sequentieller MaximalDurchsatz [MB/s] 64 kB Blockgröße Lesen Schreiben Maximale Transaktionsraten für wahlfreie Zugriffe [IO/s] 8 kB Blockgröße 64 kB Blockgröße Leseanteil: Leseanteil: 67% HDD SATA, 6 Gb/s, 2.5 1000 GB, 7200 rpm hot-plug-fähig Kategorie geschäftskritisch (BC) 67% 50% SATA-6G-HDD 108 MB/s 107 MB/s 372 IO/s 317 IO/s 314 IO/s HDD SAS, 6 Gb/s, 2.5 146 GB, 15000 rpm, Kategorie Enterprise (EP) SAS-6G-HDD 207 MB/s 204 MB/s 594 IO/s 506 IO/s 492 IO/s SSD SAS, 6 Gb/s, 2.5 200 GB, hot-plug-fähig, Kategorie Enterprise (EP) SAS-6G-SSD 339 MB/s 196 MB/s 14184 IO/s 3006 IO/s 2985 IO/s Diese und weitere Informationen zu den für die PRIMERGY Server freigegebenen Festplatten finden sich im White Paper „Performance einzelner Festplatten“. http://www.fujitsu.com/de/primergy Seite 17 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Controller-Vergleich In den bisherigen Kapiteln sind alle wesentlichen Vorinformationen zu den Controllern gegeben worden. Diese Informationen werden schon in vielen Fällen die Controller-Auswahl für einen gegebenen Anwendungsfall einengen. Wenn weitere kundenseitige Informationen über den geplanten Controller-Einsatz hinzugenommen werden, lässt sich schon sehr viel mehr über die mit den einzelnen Controllern zu erwartende Performance sagen. In diesem Kapitel sollen daher die Controller differenziert für verschiedene RAID-Levels, Anwendungsszenarien, Belastungsintensitäten, Festplattenanzahlen sowie Festplattentechnologien verglichen werden. Die Aussagen werden dabei mit Hilfe von Messergebnissen veranschaulicht. Die Vergleiche sind gegliedert in die folgenden Unterkapitel, die unabhängig voneinander gelesen werden können: RAID 1 (zwei SATA-Festplatten) RAID 1 (zwei SAS-Festplatten) RAID 0 und 10 (vier SATA-Festplatten) RAID 0 und 10 (fünf bis acht Festplatten) RAID 0 und 10 (mehr als acht Festplatten) RAID 5 Allgemeine Vorbemerkungen zu den Vergleichen: Bei den Vergleichen werden meist die im Kapitel „Messverfahren“ beschriebenen fünf Lastprofile „File copy“, „Database“, „File server“, „Streaming“ und „Restore“ verwendet. Damit wird eine angemessene Abdeckung der wahlfreien und sequentiellen Anwendungsszenarien erreicht. Wenn das kundenseitige Belastungsprofil wesentlich hiervon abweicht, gelten die hier gemachten Aussagen nicht mehr uneingeschränkt. Als Maß für die Leistungsfähigkeit eines Disk-Subsystems wird wie allgemein üblich bei wahlfreien Lastprofilen die Transaktionsrate in IO/s angegeben und bei sequentiellen Lastprofilen der Durchsatz in MB/s. Es werden jeweils alle Controller diskutiert, die den gerade betrachteten RAID-Level und Festplattentyp unterstützen. Zwecks besserer Überschaubarkeit beschränken sich die Grafiken des aktuellen Kapitels meist auf die erreichbaren Maximalwerte. Diese werden in der Regel erst bei einer hohen Belastungsintensität des Disk-Subsystems erreicht. Exemplarisch für die Festplattentechnologien werden die drei im Kapitel „Messumgebung“ näher behandelten Festplattentypen benutzt (SATA-6G-HDD, SAS-6G-HDD und SAS-6G-SSD). Dort sind auch deren wesentliche Performance-Daten zusammengestellt. An einigen Stellen in den folgenden Vergleichen werden die erreichten Performance-Werte auf Basis der Performance-Daten dieser Festplattentypen erklärt. Da die maximal mit den Controllern erreichbare Performance Gegenstand dieses Dokumentes ist, wurden für die Messungen die unveränderten Cache- und Festplatteneinstellungen von „ServerView RAID“ im Modus „Performance“ zugrunde gelegt, und nicht die des Modus‘ „Data Protection“. Bei ausreichender kundenseitiger Absicherung gegen Stromausfälle ist diese Einstellung sinnvoll. Wenn eine Änderung dieser Einstellungen vorteilhaft ist, wird das im Einzelfall erwähnt. Konventionelle Festplatten (im Gegensatz zu SSDs) werden bei den nun folgenden ControllerVergleichen nur noch kurz als „HDDs“ bezeichnet. Die Gruppe der LSI2208-Controller unterstützt in der neuesten Generation PCIe 3.0. Dies bedeutet im Wesentlichen eine höhere Durchsatzgrenze, die in Konfigurationen mit vielen Festplatten erreicht wird. Daher gelten Aussagen über Konfigurationen mit bis zu acht Festplatten noch gleichermaßen für die Generationen PCIe 2.0 und 3.0. In den entsprechenden Kapiteln werden die beiden Generationen also nicht getrennt dargestellt. Nur bei den größeren Konfigurationen RAID 0 und RAID 10 mit mehr als acht Festplatten, sowie RAID 5 mit 24 Festplatten ist eine getrennte Behandlung der Generation PCIe 3.0 sinnvoll, und zwar anhand des LSI2208-1G-3.0-Controllers. Seite 18 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID 1 (zwei SATA-Festplatten) Diesen Fall lohnt es gesondert zu betrachten, da nur so alle Onboard-Controller und ein großer Teil der PCIe-Controller miteinander verglichen werden können. Dies geschieht mit der im Kapitel „Messumgebung“ näher beschriebenen SATA-6G-HDD. Die Performance-Werte für die einzelnen Lastprofile werden größtenteils durch die HDDs bestimmt, da die Controller bei dieser HDD-Anzahl noch nicht an ihren Grenzen arbeiten. Wahlfreie Zugriffe RAID 1 mit zwei SATA-6G-HDDs Die Grafik zeigt einen Controller-Vergleich für zwei SATA-6G-HDDs konfiguriert als RAID 1. Die drei Säulengruppen in der Grafik stellen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße) dar. File copy File server LSI2208 LSI2108 LSI2008 Patsburg A/B CougarPoint LSI2208 LSI2108 LSI2008 Patsburg A/B CougarPoint LSI2208 LSI2108 LSI2008 Patsburg A/B 750 700 650 600 550 500 450 400 350 300 250 200 150 100 50 0 CougarPoint Transaction rate [IO/s] Maximale Transaktionsraten, wahlfreier Zugriff, RAID 1, 2 SATA-6G-HDDs Database Der LSI2108- und der LSI2208-Controller liefern hier insgesamt die höchsten Transaktionsraten. http://www.fujitsu.com/de/primergy Seite 19 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Sequentielle Zugriffe RAID 1 mit zwei SATA-6G-HDDs Die nächste Grafik zeigt einen Controller-Vergleich für zwei SATA-6G-HDDs konfiguriert als RAID 1. Die zwei Säulengruppen in der Grafik stellen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße) dar. Maximale Durchsätze, sequentieller Zugriff, RAID 1, 2 SATA-6G-HDDs 220 Throughput [MB/s] 200 180 160 140 120 100 LSI2208 LSI2108 LSI2008 Patsburg A/B CougarPoint LSI2208 LSI2108 20 LSI2008 40 Patsburg A/B 60 CougarPoint 80 0 Streaming Restore Insgesamt liegen in der Mehrzahl der Fälle bei diesem RAID-Level die maximalen Durchsätze nahe bei den Maximalwerten einer einzelnen Festplatte. Beim Lesen nutzen der LSI2008-, der LSI2108- und der LSI2208-Controller bei höheren Belastungsintensitäten beide Festplatten und zeigen dadurch einen höheren maximalen Durchsatz. Seite 20 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID 1 (zwei SAS-Festplatten) Auch diesen Fall lohnt es gesondert zu betrachten, da nur hier alle PCIe-Controller und zumindest ein Onboard-Controller miteinander verglichen werden können. Dies geschieht mit der im Kapitel „Messumgebung“ näher beschriebenen SAS-6G-HDD und der SAS-6G-SSD. Wahlfreie Zugriffe RAID 1 mit zwei SAS-6G-HDDs Die Grafik zeigt einen Controller-Vergleich für zwei SAS-6G-HDDs konfiguriert als RAID 1. Die drei Säulengruppen in der Grafik stellen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße) dar. Maximale Transaktionsraten, wahlfreier Zugriff, RAID 1, 2 SAS-6G-HDDs Transaction rate [IO/s] 1100 1000 900 800 700 600 500 LSI2208-1G LSI2108 LSI2008 LSI1068 LSI1064 Patsburg B LSI2208-1G LSI2108 LSI2008 LSI1068 Patsburg B LSI1064 LSI2208-1G LSI2108 LSI2008 100 LSI1068 200 LSI1064 300 Patsburg B 400 0 File copy File server Database Der LSI2108- und der LSI2208-Controller liefern hier insgesamt die höchsten Transaktionsraten. http://www.fujitsu.com/de/primergy Seite 21 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID 1 mit zwei SAS-6G-SSDs Die Grafik zeigt einen Controller-Vergleich für zwei SAS-6G-SSDs konfiguriert als RAID 1. Die drei Säulengruppen in der Grafik stellen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße) dar. Maximale Transaktionsraten, wahlfreier Zugriff, RAID 1, 2 SAS-6G-SSDs Transaction rate [IO/s] 22000 20000 18000 16000 14000 12000 10000 LSI2208-1G LSI2108 LSI2008 Patsburg B LSI2208-1G LSI2108 LSI2008 Patsburg B LSI2208-1G 2000 LSI2108 4000 LSI2008 6000 Patsburg B 8000 0 File copy File server Database Der LSI2108- und der LSI2208-Controller liefern hier insgesamt die höchsten Transaktionsraten. Sequentielle Zugriffe RAID 1 mit zwei SAS-6G-HDDs LSI2208-1G LSI2108 LSI2008 LSI1068 LSI1064 Patsburg B LSI2208-1G LSI2108 LSI2008 LSI1068 40 LSI1064 80 Patsburg B Throughput [MB/s] Die nächste Grafik zeigt einen Controller-Vergleich für zwei SAS-6G-HDDs konfiguriert als RAID 1. Die zwei Säulengruppen in der Grafik stellen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße) dar. Maximale Durchsätze, sequentieller Zugriff, RAID 1, 2 SAS-6G-HDDs Beim Schreiben liegen in allen Fällen bei diesem RAID-Level die maximalen 400 Durchsätze nahe bei den 360 Maximalwerten einer einzelnen Festplatte. 320 Beim Lesen nutzen hier alle 280 Controller außer dem 240 Patsburg B bei höheren Belastungsintensitäten 200 beide HDDs und erreichen 160 dadurch höhere Lesedurchsätze, als eine 120 einzelne HDD liefern würde. 0 Streaming Seite 22 (54) Restore http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID 1 mit zwei SAS-6G-SSDs Streaming LSI2208-1G LSI2108 LSI2008 Patsburg B LSI2208-1G LSI2108 LSI2008 250 200 150 100 50 0 Patsburg B Throughput [MB/s] Die nächste Grafik zeigt einen Controller-Vergleich für zwei SAS-6G-SSDs konfiguriert als RAID 1. Die zwei Säulengruppen in der Grafik stellen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße) dar. Beim Schreiben liegen in allen Fällen bei diesem Maximale Durchsätze, sequentieller Zugriff, RAID 1, 2 SAS-6G-SSDs RAID-Level die maximalen Durchsätze nahe bei den 750 Maximalwerten einer 700 einzelnen Festplatte. 650 Beim Lesen nutzt hier die 600 550 Mehrzahl der Controller bei 500 höheren Belastungs450 intensitäten beide SSDs und 400 erreicht dadurch höhere 350 Lesedurchsätze, als eine 300 einzelne SSD liefern würde. Restore Der Patsburg-B-Controller erreicht beim Standardlastprofil „Streaming“ etwa 500 MB/s. Das entspricht etwa der zweifachen praktischen Durchsatzgrenze einer SAS-3G-Verbindung. Damit sind die beiden SAS-3GVerbindungen vollständig ausgelastet. Die höchsten sequentiellen Durchsätze erzielt man hier mit dem LSI2108- und dem LSI2208-Controller. Beide erreichen beim Standardlastprofil „Streaming“ Durchsätze von deutlich mehr als 500 MB/s. http://www.fujitsu.com/de/primergy Seite 23 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID 0 und 10 (vier SATA-Festplatten) In diesem Unterkapitel werden die in RAID 1 (zwei SATA-Festplatten) durchgeführten Controller-Vergleiche fortgeführt für vier Festplatten. Bei dieser höheren Festplattenanzahl zeigen sich schon klare Unterschiede zwischen den Controllern. Im Falle von RAID 0 haben die Controller mit Cache in der Regel eine höhere maximale Performance, wenn man den Controller-Cache abschaltet. Daher beruhen die Transaktionsraten des LSI2108- und LSI2208-1GControllers in diesem Unterkapitel auf folgenden Änderungen gegenüber den Standardeinstellungen des Modus‘ „Performance“ von ServerView RAID: Read Mode von „Read-ahead” nach „No read-ahead“ Write Mode von „Always write-back” nach „Write-through“ Für RAID 10 wurden die Standardeinstellungen verwendet. Wahlfreie Zugriffe RAID 0 mit vier SATA-6G-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des Festplattenverbandes für RAID 0 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). File copy File server LSI2208-1G LSI2108 LSI2008 Patsburg A CougarPoint LSI2208-1G LSI2108 LSI2008 Patsburg A CougarPoint LSI2208-1G LSI2108 LSI2008 Patsburg A 1500 1400 1300 1200 1100 1000 900 800 700 600 500 400 300 200 100 0 CougarPoint Transaction rate [IO/s] Maximale Transaktionsraten, wahlfreier Zugriff, RAID 0, 4 SATA-6G-HDDs Database Es ist deutlich zu erkennen, dass die Transaktionsraten umso höher sind, je höherwertiger der Controller ist. Seite 24 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID 10 mit vier SATA-6G-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des Festplattenverbandes für RAID 10 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Maximale Transaktionsraten, wahlfreier Zugriff, RAID 10, 4 SATA-6G-HDDs Transaction rate [IO/s] 1200 1100 1000 900 800 700 600 500 LSI2208-1G LSI2108 LSI2008 Patsburg A CougarPoint LSI2208-1G LSI2108 LSI2008 Patsburg A CougarPoint LSI2208-1G LSI2108 100 LSI2008 200 Patsburg A 300 CougarPoint 400 0 File copy File server Database Auch hier ist deutlich zu erkennen, dass die Transaktionsraten umso höher sind, je höherwertiger der Controller ist. http://www.fujitsu.com/de/primergy Seite 25 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Sequentielle Zugriffe RAID 0 mit vier SATA-6G-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren maximalen Durchsätze des Festplattenverbandes für RAID 0 bei sequentiellen Lastprofilen dar. Die beiden Säulengruppen in der Grafik zeigen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße). In diesen Fällen liefern alle Maximale Durchsätze, sequentieller Zugriff, RAID 0, 4 SATA-6G-HDDs Controller etwa die gleiche Performance. 450 350 300 250 LSI2208-1G LSI2108 LSI2008 Patsburg A CougarPoint LSI2208-1G 50 LSI2108 100 LSI2008 150 Patsburg A 200 CougarPoint Throughput [MB/s] 400 0 Streaming Restore RAID 10 mit vier SATA-6G-HDDs Throughput [MB/s] Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren maximalen Durchsätze des Festplattenverbandes für RAID 10 bei sequentiellen Lastprofilen dar. Die beiden Säulengruppen in der Grafik zeigen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße). In den meisten dieser Fälle Maximale Durchsätze, sequentieller Zugriff, RAID 10, 4 SATA-6G-HDDs liefern alle Controller die gleiche Performance. Lediglich der LSI2108400 Controller arbeitet in diesem Fall beim Standardlastprofil 350 „Streaming“ in einem Bereich, in dem er nicht nur von zwei, 300 sondern von vier HDDs 250 gleichzeitig liest und dadurch den Durchsatz deutlich über 200 den doppelten Wert für eine einzelne HDD steigern kann. LSI2208-1G LSI2108 LSI2008 Patsburg A CougarPoint LSI2208-1G LSI2108 LSI2008 50 Patsburg A 100 CougarPoint 150 0 Streaming Seite 26 (54) Restore http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID 0 und 10 (fünf bis acht Festplatten) Zum Betrieb von mehr als vier Festplatten in den jetzigen PRIMERGY-Servern reichen die OnboardController nicht mehr aus, daher werden im Folgenden ausschließlich die PCIe-Controller verglichen. Da zwei der PCIe-Controller für maximal acht Festplatten freigegeben sind (LSI1068 und LSI2008), ist es sinnvoll einen Vergleich aller Controller bei acht angeschlossenen Festplatten durchzuführen. Die in diesem Unterkapitel zusammengestellten Performance-Werte decken zugleich repräsentativ den Bereich mittlerer Festplattenanzahlen ab. Da hierbei speziell die Maximalwerte bei höherem Performance-Bedarf interessieren, werden zur Verdeutlichung Messungen mit leistungsfähigen SAS-6G-HDDs oder SAS-6GSSDs benutzt. Diese Festplatten sind im Kapitel „Messumgebung“ näher beschrieben. Im Gegensatz zum LSI1068-Controller wird der LSI1064-Controller hier nicht mehr betrachtet, da letzterer in allen freigegebenen Konfigurationen maximal den Anschluss von vier Festplatten erlaubt. Die Performancerelevanten Aspekte dieses Controllers sind ausreichend im vorigen Unterkapitel „RAID 1 (zwei SASFestplatten)“ behandelt worden. Im Falle von RAID 0 haben die Controller mit Cache in der Regel eine höhere maximale Performance, wenn man den Controller-Cache abschaltet. Daher beruhen die Transaktionsraten des LSI2108- und LSI2208-1GControllers in diesem Unterkapitel auf folgenden Änderungen gegenüber den Standardeinstellungen des Modus‘ „Performance“ von ServerView RAID: Read Mode von „Read-ahead” nach „No read-ahead“ Write Mode von „Always write-back” nach „Write-through“ Für RAID 10 wurden die Standardeinstellungen verwendet. Wahlfreie Zugriffe Bei der Betrachtung der wahlfreien Zugriffe für größere Anzahlen von Festplatten ist es sinnvoll, zwischen HDDs und SSDs zu unterscheiden, da die Maximalwerte bei SSDs in einer ganz anderen Größenordnung liegen. HDDs Im Folgenden werden die Controller bei wahlfreien Zugriffen auf HDDs verglichen. Hierbei sind die maximalen Transaktionsraten des Speichermediums für das verwendete Lastprofil der wichtigste begrenzende Faktor. Dennoch ist die Performance in solchen Fällen nicht ganz unabhängig vom Controller, da es bei den Controllern ohne Cache (LSI1068 und LSI2008) noch einen zusätzlichen Einfluss gibt, auf den an den entsprechenden Stellen hingewiesen wird. Obwohl die nun folgenden Resultate mit acht SAS-6GHDDs gewonnen wurden, kann man sie auch verwenden, um für andere Festplattentypen und -anzahlen (≤ 8) die zu erwartenden maximalen Transaktionsraten abzuschätzen. Die Durchsätze, die bei wahlfreien Zugriffen auf HDDs entstehen, sind so niedrig, dass eventuelle Limitierungen an der PCIe- oder SASSchnittstelle der Controller keine Rolle spielen. http://www.fujitsu.com/de/primergy Seite 27 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID 0 mit acht SAS-6G-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des Festplattenverbandes für RAID 0 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Maximale Transaktionsraten, wahlfreier Zugriff, RAID 0, 8 SAS-6G-HDDs 6500 Transaction rate [IO/s] 6000 5500 5000 4500 4000 3500 3000 LSI2208-1G LSI2108 LSI2008 LSI1068 LSI2208-1G LSI2108 LSI2008 LSI1068 500 LSI2108 1000 LSI2008 1500 LSI1068 2000 LSI2208-1G 2500 0 File copy File server Database Die zwei rechten Säulen in jeder der drei Säulengruppen dieser Grafik stellen die zwei Controller mit Cache dar (LSI2108 und LSI2208-1G). Beide erreichen für jedes der drei Lastprofile ungefähr die maximale Transaktionsrate dieses RAID-Verbandes. Die beiden anderen Controller (LSI1068 und LSI2008) erreichen jeweils nur etwa 60% bis 90% davon. Eine genauere Analyse der Transaktionsraten würde zeigen, dass diese beiden Controller für wahlfreie Lastprofile bei niedrigen bis mittleren Belastungsintensitäten (bis zu etwa 32 parallelen Zugriffen beim LSI2008 bzw. 64 beim LSI1068) ähnliche Performance-Werte haben wie die beiden Controller mit Cache. Für höhere Parallelitäten behalten dann der LSI1068- und der LSI2008Controller die bis dahin erreichten Transaktionsraten bei. Dieser prinzipielle Unterschied zwischen den beiden Gruppen von Controllern bei wahlfreien Zugriffen ist hier exemplarisch für acht Festplatten dargestellt. Der genaue Prozentsatz dieses Unterschiedes hängt von der Größe des RAID-Verbandes und vom Festplattentyp ab. Der Unterschied ist auch für RAID-Verbände mit kleineren Festplattenanzahlen relevant, sofern solche RAID-Verbände eine Performance-Steigerung oberhalb von 32 parallelen Zugriffen zeigen können. Bei den Messungen im Unterkapitel „RAID 1 (zwei SAS-Festplatten)“ ist der Unterschied noch nicht erkennbar, bei den Messungen in RAID 0 und 10 (vier SATA-Festplatten) ist er jedoch schon signifikant. Bei den vorgestellten Messungen fällt übrigens auf, dass für die Lastprofile mit der Blockgröße 64 kB nur etwa die halbe Transaktionsrate möglich ist wie bei dem Lastprofil mit der 8 kB Blockgröße, obwohl die 1 maximalen Transaktionsraten des verwendeten HDD-Typs bei allen drei Lastprofilen relativ ähnlich sind. 1 Der Grund ist die Initialisierung des RAID-Verbandes mit der elementaren Blockgröße von 64 kB („stripe size“). Das wahlfreie Lastprofil mit der Blockgröße 8 kB, die klein ist gegenüber der „stripe size“, kann direkt nach der Formel HDD-Anzahl × HDD-Performance abgeschätzt werden. Verwendet das Lastprofil die gleiche Blockgröße, mit der der RAID-Verband initialisiert wurde, kann nur etwa die Hälfte davon erreicht werden. Eine ausführliche Begründung würde hier zu weit führen. Seite 28 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID 10 mit acht SAS-6G-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des Festplattenverbandes für RAID 10 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen in der Grafik zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Der LSI1068-Controller ist hier nicht mehr vertreten, da er RAID 10 nicht unterstützt. Maximale Transaktionsraten, wahlfreier Zugriff, RAID 10, 8 SAS-6G-HDDs 4500 4000 3500 3000 2500 LSI2208-1G LSI2108 LSI2008 LSI2208-1G LSI2108 500 LSI2108 1000 LSI2008 1500 LSI2008 2000 LSI2208-1G Transaction rate [IO/s] 5000 0 File copy File server Database In der Grafik zeigt sich dasselbe prinzipielle Verhalten wie bei RAID 0. Das heißt: Der Controller ohne Cache (LSI2008) erreicht für alle drei dargestellten Lastprofile maximal etwa 70% der Transaktionsrate der anderen beiden Controller mit Cache. Auch für diesen RAID-Level ist das ein Performance-Unterschied, der sich erst oberhalb von 32 parallelen Zugriffen auf den RAID-Verband ergibt. http://www.fujitsu.com/de/primergy Seite 29 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 SSDs Während bei wahlfreien Zugriffen auf eine einzelne HDD die maximal mögliche Transaktionsrate bei eingeschaltetem Festplatten-Cache normalerweise < 700 IO/s ist, ist sie bei einer SAS-6G-SSD ungefähr um den Faktor 20 größer. Durch eine so hohe Transaktionsrate können Verbände aus mehreren SAS-6G-SSDs auch bei wahlfreien Zugriffen Durchsätze von mehreren hundert MB/s liefern. Das wiederum bedeutet, dass die Ressourcen und Schnittstellen der Controller in viel höherem Maße ausgelastet werden als bei HDDs und die Unterschiede zwischen den Controller-Generationen erkennbar werden. RAID 0 mit acht SAS-6G-SSDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des SSDVerbandes für RAID 0 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Maximale Transaktionsraten, wahlfreier Zugriff, RAID 0, 8 SAS-6G-SSDs Transaction rate [IO/s] 120000 110000 100000 90000 80000 70000 60000 50000 LSI2208-1G LSI2108 LSI2008 LSI2208-1G LSI2108 LSI2008 10000 LSI2108 20000 LSI2008 30000 LSI2208-1G 40000 0 File copy File server Database Am leistungsfähigsten ist hier der LSI2208-1G-Controller. Es ist auch interessant, sich die Durchsatzwerte klarzumachen, die mit diesen Transaktionsraten verbunden sind. Trotz der geringeren Transaktionsraten haben die beiden Lastprofile mit 64 kB Blockgröße die höheren Durchsätze. Der LSI2208-1G-Controller bewältigt beispielsweise beim Lastprofil „File server“ etwa 1563 MB/s Durchsatz. Die nächste wesentliche Frage lautet: Inwieweit skaliert die nutzbare Transaktionsrate eines solchen RAIDVerbandes mit der SSD-Anzahl? Der LSI2208-1G-Controller erreicht bei acht SSDs für alle drei wahlfreien Lastprofile etwa die achtfache Transaktionsrate einer einzelnen SSD; er ist also noch nicht überlastet. Der LSI2108-Controller erreicht je nach wahlfreiem Lastprofil etwa das Fünf- bis Siebenfache einer einzelnen SSD; er wäre also schon etwas im Überlastbereich. Seite 30 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID 10 mit acht SAS-6G-SSDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des SSDVerbandes für RAID 10 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Maximale Transaktionsraten, wahlfreier Zugriff, RAID 10, 8 SAS-6G-SSDs Transaction rate [IO/s] 60000 55000 50000 45000 40000 35000 30000 25000 LSI2208-1G LSI2108 LSI2008 LSI2208-1G LSI2108 LSI2008 5000 LSI2108 10000 LSI2008 15000 LSI2208-1G 20000 0 File copy File server Database Auch hier hat der LSI2208-1G-Controller einen sehr deutlichen Vorsprung, vor allem bei kleinen Blöcken. http://www.fujitsu.com/de/primergy Seite 31 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Sequentielle Zugriffe Im Folgenden werden anhand von Messungen mit acht Festplatten allgemeingültige Aussagen über die Controller bei sequentiellen Zugriffen zusammengestellt. Hierbei ist es sinnvoll, zwischen HDDs und SSDs zu unterscheiden, da bei den HDDs ein Controller-Modell mehr freigegeben ist und bei den SSDs die Durchsatzgrenzen des LSI2008-Controllers besser veranschaulicht werden können. Für andere Festplattentypen und -anzahlen (≤ 8) kann man sich die zu erwartenden maximale Durchsätze hieraus durch geeignete Multiplikation errechnen. Wenn der so errechnete Durchsatz den Grenzwert des Controllers übersteigt, wird der Controller-Grenzwert wirksam. HDDs RAID 0 mit acht SAS-6G-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Durchsätze des Festplattenverbandes für RAID 0 bei sequentiellen Lastprofilen dar. Die beiden Säulengruppen in der Grafik zeigen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße). Maximale Durchsätze, sequentieller Zugriff, RAID 0, 8 SAS-6G-HDDs 1600 1400 1200 1000 PCIe 1.0-x4 800 LSI2208-1G LSI2108 LSI2008 LSI2108 LSI2008 200 LSI1068 400 LSI1068 600 LSI2208-1G Throughput [MB/s] Die Grafik zeigt, dass für sequentielle Durchsätze von 800 MB/s oder mehr der LSI1068-Controller nicht mehr ausreicht. Dies ist bedingt durch die Durchsatzgrenze der PCIeSchnittstelle (PCIe 1.0, x4, schwarze gestrichelte waagerechte Linie). Für höhere Durchsätze ist also einer der drei anderen Controller zu verwenden. 0 Streaming Seite 32 (54) Restore http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID 10 mit acht SAS-6G-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Durchsätze des Festplattenverbandes für RAID 10 bei sequentiellen Lastprofilen dar. Die beiden Säulengruppen in der Grafik zeigen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße). Maximale Durchsätze, sequentieller Zugriff, RAID 10, 8 SAS-6G-HDDs 1400 1200 1000 800 LSI2208-1G LSI2108 LSI2108 200 LSI2008 400 LSI2008 600 LSI2208-1G Throughput [MB/s] Beim sequentiellen Lesen und Schreiben erreichen oder übertreffen alle drei betrachteten Controller für diesen RAID-Verband einen Durchsatz von annähernd dem vierfachen Maximaldurchsatz einer einzelnen HDD (hier also etwa 800 MB/s). 0 Streaming http://www.fujitsu.com/de/primergy Restore Seite 33 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 SSDs RAID 0 mit acht SAS-6G-SSDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Durchsätze des Festplattenverbandes für RAID 0 bei sequentiellen Lastprofilen dar. Die beiden Säulengruppen in der Grafik zeigen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße). Insgesamt kommt man hier mit dem LSI2208-1GController am weitesten. Streaming LSI2208-1G LSI2108 LSI2008 LSI2208-1G LSI2108 2800 2600 2400 2200 2000 1800 1600 1400 1200 1000 800 600 400 200 0 LSI2008 Throughput [MB/s] Maximale Durchsätze, sequentieller Zugriff, RAID 0, 8 SAS-6G-SSDs Restore RAID 10 mit acht SAS-6G-SSDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Durchsätze des Festplattenverbandes für RAID 10 bei sequentiellen Lastprofilen dar. Die beiden Säulengruppen in der Grafik zeigen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße). Auch hier kommt man mit dem LSI2208-1G-Controller am weitesten. Streaming Seite 34 (54) LSI2208-1G LSI2108 LSI2008 LSI2208-1G LSI2108 2800 2600 2400 2200 2000 1800 1600 1400 1200 1000 800 600 400 200 0 LSI2008 Throughput [MB/s] Maximale Durchsätze, sequentieller Zugriff, RAID 10, 8 SAS-6G-SSDs Restore http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID 0 und 10 (mehr als acht Festplatten) Zum Betrieb von mehr als acht Festplatten in den jetzigen PRIMERGY-Servern stehen die drei leistungsfähigsten Controller zur Verfügung: der LSI2108-Controller und der LSI2208-1G-2.0- bzw. LSI22081G-3.0-Controller. Hiermit sind derzeit Server-Konfigurationen mit bis zu 24 internen Festplatten möglich (z. B. in der PRIMERGY TX300 S7). Die Vergleiche bei RAID 0 werden mit 24 Festplatten durchgeführt, und die Vergleiche bei RAID 10 mit 16 Festplatten (letzteres ist bei RAID 10 die derzeitige Obergrenze für einen einzelnen RAID-Verband). Hierdurch wird repräsentativ der Bereich großer Festplattenanzahlen abgedeckt. Wie auch im vorhergehenden Unterkapitel werden zur Verdeutlichung Messungen mit leistungsfähigen SAS6G-HDDs oder SAS-6G-SSDs benutzt. Diese Festplatten sind im Kapitel „Messumgebung“ näher beschrieben. Im Falle von RAID 0 haben die Controller mit Cache in der Regel eine höhere maximale Performance, wenn man den Controller-Cache abschaltet. Daher beruhen die Transaktionsraten des LSI2108- und LSI2208-1GControllers in diesem Unterkapitel auf folgenden Änderungen gegenüber den Standardeinstellungen des Modus‘ „Performance“ von ServerView RAID: Read Mode von „Read-ahead” nach „No read-ahead“ Write Mode von „Always write-back” nach „Write-through“ Für RAID 10 wurden die Standardeinstellungen verwendet. http://www.fujitsu.com/de/primergy Seite 35 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Wahlfreie Zugriffe Bei der Betrachtung der wahlfreien Zugriffe für größere Anzahlen von Festplatten ist es sinnvoll, zwischen HDDs und SSDs zu unterscheiden, da die Maximalwerte bei SSDs in einer ganz anderen Größenordnung liegen. HDDs Im Folgenden werden die Controller bei wahlfreien Zugriffen auf HDDs verglichen. Hierbei sind die maximalen Transaktionsraten des Speichermediums für das verwendete Lastprofil der wichtigste begrenzende Faktor. Obwohl die nun folgenden Resultate mit 24 SAS-6G-HDDs gewonnen wurden, kann man sie auch verwenden, um für andere Festplattentypen und -anzahlen (≤ 24) die zu erwartenden maximalen Transaktionsraten abzuschätzen. Die Durchsätze, die bei wahlfreien Zugriffen auf HDDs entstehen, sind so niedrig, dass eventuelle Limitierungen an der PCIe- oder SAS-Schnittstelle der Controller keine Rolle spielen. RAID 0 mit 24 SAS-6G-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des Festplattenverbandes für RAID 0 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Maximale Transaktionsraten, wahlfreier Zugriff, RAID 0, 24 SAS-6G-HDDs Transaction rate [IO/s] 16000 14000 12000 10000 8000 LSI2208-1G LSI2108 LSI2208-1G LSI2108 2000 LSI2108 4000 LSI2208-1G 6000 0 File copy File server Database Die verwendeten SAS-6G-Festplatten haben für das Lastprofil „Database“ die maximale Transaktionsrate 594 IO/s. Theoretisch sollte also ein Verband aus 24 solchen Festplatten maximal 594 IO/s × 24 = 14256 IO/s schaffen. Die maximale gemessene Transaktionsrate für das Lastprofil „Database“ beträgt 14396 IO/s; die Überschlagsrechnung wird also gut bestätigt. Für die Lastprofile mit der Blockgröße 64 kB ist bei den hier vorgestellten Messungen nur etwa die halbe Transaktionsrate möglich wie bei dem Lastprofil mit der 8 kB Blockgröße, obwohl die maximalen Transaktionsraten des verwendeten HDD-Typs bei allen drei 2 Lastprofilen relativ ähnlich sind. Alle Controller erreichen für jedes der drei Lastprofile ungefähr die maximale Transaktionsrate dieses RAIDVerbandes. 2 Der Grund ist die Initialisierung des RAID-Verbandes mit der elementaren Blockgröße von 64 kB („stripe size“). Das wahlfreie Lastprofil mit der Blockgröße 8 kB, die klein ist gegenüber der „stripe size“, kann direkt nach der Formel HDD-Anzahl × HDD-Performance abgeschätzt werden. Verwendet das Lastprofil die gleiche Blockgröße, mit der der RAID-Verband initialisiert wurde, kann nur etwa die Hälfte davon erreicht werden. Eine ausführliche Begründung würde hier zu weit führen. Seite 36 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID 10 mit 16 SAS-6G-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des Festplattenverbandes für RAID 10 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen in der Grafik zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Maximale Transaktionsraten, wahlfreier Zugriff, RAID 10, 16 SAS-6G-HDDs Transaction rate [IO/s] 9000 8000 7000 6000 5000 4000 LSI2208-1G LSI2108 LSI2208-1G LSI2108 1000 LSI2208-1G 2000 LSI2108 3000 0 File copy File server Database In der Grafik zeigt sich dasselbe prinzipielle Verhalten wie bei RAID 0. http://www.fujitsu.com/de/primergy Seite 37 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 SSDs Während bei wahlfreien Zugriffen auf eine einzelne HDD die maximal mögliche Transaktionsrate bei eingeschaltetem Festplatten-Cache normalerweise < 700 IO/s ist, ist sie bei einer SAS-6G-SSD ungefähr um den Faktor 20 größer. Durch eine so hohe Transaktionsrate können Verbände aus mehreren SAS-6G-SSDs auch bei wahlfreien Zugriffen Durchsätze von mehreren hundert MB/s liefern. Das wiederum bedeutet, dass die Ressourcen und Schnittstellen der Controller in viel höherem Maße ausgelastet werden als bei HDDs und die Unterschiede zwischen den Controller-Generationen erkennbar werden. RAID 0 mit 24 SAS-6G-SSDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des SSDVerbandes für RAID 0 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Maximale Transaktionsraten, wahlfreier Zugriff, RAID 0, 24 SAS-6G-SSDs 180000 160000 140000 120000 100000 LSI2208-1G LSI2108 20000 LSI2208-1G 40000 LSI2108 60000 LSI2108 80000 LSI2208-1G Transaction rate [IO/s] 200000 0 File copy File server Database Am leistungsfähigsten ist hier der LSI2208-1G-Controller. Dieser erreicht bei dem Lastprofil mit kleiner Blockgröße („Database“) in etwa die zweieinhalbfache Transaktionsrate wie der LSI2108-Controller. In Form von SAS-6G-SSD-Anzahlen ausgedrückt heißt das: Um beispielsweise im Falle von RAID 0 die Möglichkeiten des LSI2208-1G-Controllers auszuschöpfen, sind je nach wahlfreiem Lastprofil 13 bis 17 SAS6G-SSDs nötig. Dies bestätigt die Aussage aus dem Unterkapitel RAID 0 und 10 (fünf bis acht Festplatten), dass der LSI2208-1G-Controller mit acht SSDs bei wahlfreien Lastprofilen noch nicht überlastet ist. Es ist auch interessant, sich die Durchsatzwerte klarzumachen, die sich durch Umrechnung aus diesen Transaktionsraten ergeben. Trotz der geringeren Transaktionsraten haben die beiden Lastprofile mit 64 kB Blockgröße die höheren Durchsätze. Der LSI2208-1G-Controller bewältigt beispielsweise beim Lastprofil „File copy“ etwa 3200 MB/s Durchsatz. Dieser Wert ist bemerkenswert, weil er höher liegt als die beiden sequentiellen Maximaldurchsätze des Controllers für 100% read und 100% write bei diesem RAID-Level. Ohne eine echte bidirektionale Nutzung der SAS-Verbindungen wäre dieser Wert nicht zu erreichen gewesen. Seite 38 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID 10 mit 16 SAS-6G-SSDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des SSDVerbandes für RAID 10 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Maximale Transaktionsraten, wahlfreier Zugriff, RAID 10, 16 SAS-6G-SSDs Transaction rate [IO/s] 65000 60000 55000 50000 45000 40000 35000 30000 LSI2208-1G LSI2108 5000 LSI2208-1G 10000 LSI2108 15000 LSI2108 20000 LSI2208-1G 25000 0 File copy File server Database Am leistungsfähigsten ist hier der LSI2208-1G-Controller. Hier ergibt sich ein ähnliches Bild wie bei RAID 10 mit acht SAS-6G-SSDs. Die Transaktionsraten können allerdings durch Verdoppeln der SSD-Anzahl auf 16 nur wenig gesteigert werden. Hieraus ergibt sich die Empfehlung, zum Erreichen maximaler Performance für RAID 10 bei wahlfreien Lastprofilen nicht mehr als zehn SSDs pro Controller anzuschließen und den LSI2208-1G-Controller zu verwenden. http://www.fujitsu.com/de/primergy Seite 39 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Sequentielle Zugriffe Bei der Betrachtung der sequentiellen Zugriffe für größere Anzahlen von Festplatten braucht meist nicht zwischen HDDs und SSDs unterschieden zu werden, da die Maximaldurchsätze beider Festplattentypen noch in einer ähnlichen Größenordnung liegen. Im Folgenden werden anhand von Messungen mit 24 SAS6G-SSDs allgemeingültige Aussagen über die Controller zusammengestellt. RAID 0 mit 24 SAS-6G-SSDs Streaming Seite 40 (54) LSI2208-1G-3.0 LSI2208-1G-2.0 LSI2108 LSI2208-1G-3.0 LSI2208-1G-2.0 3200 3000 2800 2600 2400 2200 2000 1800 1600 1400 1200 1000 800 600 400 200 0 LSI2108 Man vergleiche diese Grafik mit der entsprechenden Grafik für RAID 0 mit acht SAS-6G-SSDs; dort wurden für den LSI2108-Controller fast dieselben Werte erreicht wie hier. Throughput [MB/s] Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Durchsätze des Festplattenverbandes für RAID 0 bei sequentiellen Lastprofilen dar. Die beiden Säulengruppen in der Grafik zeigen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße). Der LSI2208-1G-3.0Controller liefert hier die Maximale Durchsätze, sequentieller Zugriff, RAID 0, 24 SAS-6G-SSDs beste Performance und überschreitet bei „Streaming“ 4000 den Grenzwert von PCIe 3800 Gen2. Bei „Restore“ limitiert 3600 3400 der SSD-Verband. Restore http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID 10 mit 16 SAS-6G-SSDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Durchsätze des Festplattenverbandes für RAID 10 bei sequentiellen Lastprofilen dar. Die beiden Säulengruppen in der Grafik zeigen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße). http://www.fujitsu.com/de/primergy Streaming LSI2208-1G-3.0 LSI2208-1G-2.0 LSI2108 LSI2208-1G-3.0 LSI2208-1G-2.0 3000 2800 2600 2400 2200 2000 1800 1600 1400 1200 1000 800 600 400 200 0 LSI2108 Man vergleiche wieder diese Grafik mit der entsprechenden Grafik für RAID 10 mit acht SAS-6GSSDs; dort wurden für den LSI2108-Controller fast dieselben Werte erreicht wie hier. Maximale Durchsätze, sequentieller Zugriff, RAID 10, 16 SAS-6G-SSDs Throughput [MB/s] Der LSI2208-1G-3.0Controller liefert auch hier die beste Performance durch PCIe Gen3. Die Unterschiede zu Gen2 fallen allerdings nicht so groß aus, da 16 SSDs insbesondere bei Lastprofil „Restore“ zu wenige sind um die höhere Durchsatzgrenze vollständig auszuschöpfen. Restore Seite 41 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 RAID 5 Bei den RAID-Levels 0, 1 und 10 kann sich der Controller darauf beschränken, die logische Position der Datenblöcke einer physikalischen Position im RAID-Verband zuzuordnen („Striping“) und ggf. ganze Blöcke gespiegelt zu schreiben („Mirroring“). Demgegenüber muss ein Controller bei RAID-Levels wie RAID 5 erheblich höhere Anforderungen bewältigen, und zwar hauptsächlich beim Schreiben. Das liegt daran, dass solche RAID-Levels zusätzliche Blöcke mit Paritätsdaten benötigen, die aus den eigentlichen Daten erst berechnet werden müssen. Die Messungen dieses Unterkapitels wurden mit dem LSI2108- und dem LSI2208-Controller durchgeführt, da nur sie standardmäßig RAID 5 unterstützen. Da speziell die Maximalwerte bei höherem PerformanceBedarf interessieren, werden zur Verdeutlichung Messungen mit leistungsfähigen SAS-6G-HDDs oder SAS6G-SSDs benutzt. Diese Festplatten sind im Kapitel „Messumgebung“ näher beschrieben. Wahlfreie Zugriffe Transaction rate [IO/s] Bei RAID 5 wird aus einem Schreibauftrag des Anwendungsszenarios eine spezifisch erhöhte Anzahl von Zugriffen auf den RAID-Verband erzeugt. Das wirkt sich besonders bei wahlfreien Zugriffen aus. Dadurch bedingt sinkt die maximal mögliche Transaktionsrate aus Sicht der Anwendung auf einen bestimmten Prozentsatz, wenn man dieselbe Menge an Festplatten zuerst als RAID 0, und danach als RAID 5 konfiguriert. Diese Prozentsätze sind in erster Näherung spezifisch für den Vergleich mit RAID 5 und das verwendete wahlfreie Lastprofil, hängen aber auch vom Controller ab. Die folgende Grafik stellt die maximalen gemessenen Transaktionsraten für einen Verband aus zwölf SAS6G-HDDs dar, der zuerst als RAID 0 und dann als RAID 5 konfiguriert wurde (exemplarisch beide Male in Verbindung mit dem LSI2108Vergleich RAID 0 und RAID 5, wahlfreier Zugriff, Controller). Die Werte für RAID 0 sind 12 SAS-6G-HDDs annähernd das technische Maximum für diesen HDD-Verband. Die drei 8000 Säulengruppen in der Grafik stellen RAID 0 × 55% 7000 die Transaktionsraten für die RAID 5 Standardlastprofile „File copy“ 6000 (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier 5000 Zugriff, 67% read, 64 kB Blockgröße) × 59% × 48% 4000 und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße) dar. Für 3000 jedes dieser drei Lastprofile ist der 2000 gemessene Wert für RAID 5 ein bestimmter Prozentsatz des Wertes 1000 für RAID 0. Diese vergleichenden 0 Prozentsätze sind über den Pfeilen in der Grafik eingetragen. File copy File Server Database Für das Lastprofil mit 50% Schreibanteil („File copy“) ermöglicht der Controller einen vergleichenden Prozentsatz von 48%; für die Lastprofile mit einem Schreibanteil von 33% („File server“ und „Database“) ermöglicht er vergleichende Prozentsätze von 59% bzw. 55%. Mit einer Abschätzung auf Basis von Vervielfachungsfaktoren für die Schreibaufträge könnte man herleiten, dass dieser vergleichende Prozentsatz im ersten Fall theoretisch 40% betragen müssten, und in den beiden anderen Fällen theoretisch 50%. Die mit dem Controller erreichten Prozentsätze liegen also jeweils eindeutig darüber. Dies ist nur möglich aufgrund des (standardmäßig eingeschalteten) Controller-Caches. Je höher diese Prozentsätze, umso besser ist das Controller-Design. Eine ausführliche Herleitung der theoretischen Prozentsätze von 40% bzw. 50% würde hier zu weit führen. Seite 42 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 HDDs Die bei RAID 5 erreichbaren Performance-Werte für wahlfreie Lastprofile sollen nun als erstes für den Fall von HDDs verdeutlicht werden. Wie bei den RAID-Levels 0, 1 und 10 (ohne Paritätsberechnung) ist auch für diesen RAID-Level bei HDDs im Gegensatz zu SSDs die maximale Performance des Speichermediums dominierend, daher ist eine getrennte Behandlung beider Festplattentechnologien sinnvoll. RAID 5 mit 24 SAS-6G-HDDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des Festplattenverbandes für RAID 5 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen in der Grafik zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Maximale Transaktionsraten, wahlfreier Zugriff, RAID 5, 24 SAS-6G-HDDs Transaction rate [IO/s] 9000 8000 7000 6000 5000 4000 LSI2208-1G LSI2108 LSI2208-1G LSI2108 1000 LSI2208-1G 2000 LSI2108 3000 0 File copy File server Database Der LSI2208-1G-Controller, also der neuere Controller mit dem größeren Cache, hat einen leichten Vorsprung. http://www.fujitsu.com/de/primergy Seite 43 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 SSDs Als Nächstes sollen die mit SAS-6G-SSDs erzielbaren Transaktionsraten diskutiert werden (nach wie vor im Falle von RAID 5 bei wahlfreien Lastprofilen). Ganz ähnlich wie bei den zuvor behandelten RAID-Levels 0 und 10 treten auch bei RAID 5 durch die Verwendung von SAS-6G-SSDs die Unterschiede zwischen den verschiedenen Controllern deutlich hervor. RAID 5 mit 24 SAS-6G-SSDs Die folgende Grafik stellt die maximalen Transaktionsraten für die verschiedenen Controller am Beispiel eines Verbandes aus 24 SAS-6G-SSDs zusammen. Die drei Säulengruppen in der Grafik zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Maximale Transaktionsraten, wahlfreier Zugriff, RAID 5, 24 SAS-6G-SSDs Transaction rate [IO/s] 45000 40000 35000 30000 25000 20000 LSI2208-1G LSI2108 LSI2208-1G LSI2108 5000 LSI2208-1G 10000 LSI2108 15000 0 File copy File server Database Der Technologiefortschritt von der vorigen zur jetzigen Controller-Generation ist hier ähnlich beeindruckend wie bei RAID 0 mit 24 SSDs: Die LSI2208-1G-Controller liefern beim Standardlastprofil „Database“ eine bis zu zweifache Transaktionsrate wie der LSI2108-Controller. In Form von SAS-6G-SSD-Anzahlen ausgedrückt heißt das: Bei RAID 5 ermöglicht es der LSI2208-1GController – je nach wahlfreiem Lastprofil – sechs bis sechzehn SAS-6G-SSDs auszulasten, ohne dass ein Engpass am Controller entsteht. Diese Abschätzung beruht neben den SAS-6G-SSD-spezifischen Maximalwerten aus dem Kapitel „Messumgebung“ auch auf den für RAID 5 gültigen Prozentsätzen für die Verminderung der maximalen Transaktionsrate vom Anfang des aktuellen Unterkapitels „Wahlfreie Zugriffe“. Seite 44 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Sequentielle Zugriffe Auch bei RAID 5 braucht bei der Betrachtung der sequentiellen Zugriffe für größere Anzahlen von Festplatten nicht zwischen HDDs und SSDs unterschieden zu werden, da die jeweiligen Maximalwerte noch in einer ähnlichen Größenordnung liegen. Im Folgenden werden anhand von Messungen mit SAS-6G-HDDs allgemeingültige Aussagen über die Controller zusammengestellt. Die zu erwartenden maximale Durchsätze lassen sich auf andere Festplattentypen und -anzahlen (≤ 24) umrechnen. Wenn der zu erwartende Durchsatz den Grenzwert des Controllers übersteigt, wird der Controller-Grenzwert wirksam. Im Falle von RAID 5 befinden sich in einer logisch zusammengehörigen Gruppe von Blöcken in einem Verband aus N Festplatten immer (N-1) Blöcke mit den eigentlichen Daten und 1 Block mit Paritätsdaten. Bei einer vollständigen sequentiellen Bearbeitung einer solchen Gruppe enthält also immer ein Anteil von 1/(N-1) die Paritätsdaten. Demnach kann eine solche sequentielle Bearbeitung nie mehr als den (N-1)-fachen Datendurchsatz einer einzelnen Festplatte für die Anwendung bereitstellen. RAID 5 mit 24 SAS-6G-SSDs Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Durchsätze des Festplattenverbandes für RAID 5 bei sequentiellen Lastprofilen dar. Die beiden Säulengruppen in der Grafik zeigen die Durchsätze für die Standardlastprofile „Streaming“ (sequentieller Zugriff, 100% read, 64 kB Blockgröße) und „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße). Streaming LSI2208-1G-3.0 LSI2208-1G-2.0 LSI2108 LSI2208-1G-3.0 LSI2208-1G-2.0 4000 3800 3600 3400 3200 3000 2800 2600 2400 2200 2000 1800 1600 1400 1200 1000 800 600 400 200 0 LSI2108 Throughput [MB/s] Maximale Durchsätze, sequentieller Zugriff, RAID 5, 24 SAS-6G-SSDs Restore Hier ist der große Vorsprung des LSI2208-1G-3.0-Controllers deutlich zu erkennen. Beim sequentiellen Lesen werden wie bei RAID 0 3800 MB/s erreicht, was deutlich über dem Grenzwert bei PCIe Gen2 liegt. Beim sequentiellen Schreiben für diesen RAID-Level erreicht der LSI2108-Controller einen maximalen Durchsatz von etwa 1200 MB/s, und der LSI2208-1G-Controller von etwa 2200 MB/s. Dieser Maximalwert für das sequentielle Schreiben ist bei RAID 5 ein wesentlicher Indikator für die Leistungsfähigkeit eines RAID-Controllers, da sich hierin relativ unverfälscht die Geschwindigkeit des Controllers bei der Berechnung der Paritätsblöcke widerspiegelt. Für Festplattenanzahlen (N) zwischen drei und 24 kann man die zu erwartenden Durchsatzwerte für die hier betrachteten sequentiellen Lastprofile wie bereits erwähnt abschätzen als das (N-1)-Fache des Durchsatzes einer einzelnen Festplatte. Grenzwerte der Controller können dabei nicht übertroffen werden. Für die im vorliegenden Dokument zu Grunde gelegte SAS-6G-HDD und SAS-6G-SSD ergäbe sich z. B. aus den Werten des Kapitels Messumgebung Folgendes: Beim Lastprofil „Restore“ sollte ab sieben HDDs bzw. ab acht SSDs der LSI2208-1G-Controller benutzt werden. http://www.fujitsu.com/de/primergy Seite 45 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Geringere Lastniveaus Die Unterschiede zwischen den Controllern zeigen sich nicht nur in den erreichbaren Maximalwerten bei hoher Belastung, sondern auch schon bei geringerer Belastung. Die folgende Tabelle stellt daher für die einzelnen Controller die Maximalwerte für die sequentiellen Durchsätze einer einzelnen Anwendung zusammen, die bei ihren Zugriffen ohne Parallelität arbeitet (im weiteren Verlauf mit „1 Outstanding IO“ bezeichnet). Diese Maximalwerte gelten für alle RAID-Level, die von den Controllern unterstützt werden, und können nicht überschritten werden. Bei RAID 0 können diese Durchsätze erreicht werden; bei anderen RAID-Levels bleiben die Durchsätze meist darunter. Controller Maximalwerte des sequentiellen Durchsatzes, 1 Outstanding IO, 64 kB Blockgröße 100% Lesen (Lastprofil „Streaming“) 100% Schreiben (Lastprofil „Restore“) LSI1068 230 MB/s 180 MB/s LSI2008 310 MB/s 340 MB/s LSI2108 670 MB/s 670 MB/s LSI2208-1G 930 MB/s 890 MB/s Voraussetzung für das Erreichen dieser Werte beim sequentiellen Lesen ist die Einstellung „Read-ahead“ und beim sequentiellen Schreiben die Einstellung „Write-back“. Diese maximalen Durchsätze sind auch stark von der Blockgröße abhängig, wobei die Größenrelationen der Tabellenwerte untereinander für andere Blockgrößen ähnlich sind. Die Unterschiede zwischen den beiden letzten Controllern der Tabelle werden spätestens dann bedeutsam, wenn der verwendete RAID-Verband groß genug ist, um mehr als 900 MB/s sequentiellen Durchsatz für „1 Outstanding IO“ zu ermöglichen. In solchen Fällen kann ein unpassend ausgewählter Controller als Einschränkung wirken. Das folgende Beispiel illustriert dies anhand von Durchsatzmessungen bei einem RAID 10-Verband aus acht SAS-6G-HDDs für das Lastprofil „Restore“ (sequentieller Zugriff, 100% write, 64 kB Blockgröße). Verglichen werden der LSI2108- und der LSI2208-1G-Controller bei verschiedenen Anzahlen von parallelen Zugriffen („# Outstanding IOs“). Throughput [MB/s] Lastprofil Restore, RAID 10, 8 SAS-6G-HDDs, bei verschiedenen Belastungsintensitäten 800 700 762 750 776 744 600 LSI2108 LSI2208-1G 500 526 400 300 408 200 100 0 1 2 4 # Outstanding I/Os Man erkennt deutlich, dass in diesem Fall der LSI2108-Controller für 1 und 2 Outstanding IOs nicht denselben Durchsatz erreicht wie der LSI2208-1G-Controller. Letzterer erreicht schon für 1 Outstanding IO einen Durchsatz von 750 MB/s, während der LSI2108-Controller nur etwas mehr als die Hälfte davon erreicht. Aus dem Blickwinkel der Antwortzeiten hieße das: Für geringe Belastungsintensitäten bei sequentiellen Zugriffen kann man mit dem LSI2208-1G-Controller im Vergleich zum LSI2108-Controller die Antwortzeiten etwa halbieren. Seite 46 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 MegaRAID Advanced Software Options CacheCade 2.0 Ausgangspunkt für die Entscheidung, CacheCade 2.0 einzusetzen, ist ein RAID-Verband aus HDDs mit überwiegend wahlfreiem Zugriff. Wird dabei ein RAID-Level mit Datensicherheit verwendet oder kommen SATA-HDDs mit hohen Kapazitäten zum Einsatz, dann ist von einer nicht allzu hohen Transaktionsrate auszugehen. Um diese zu steigern, können SSDs und CacheCade 2.0 eingesetzt werden. Voraussetzung ist allerdings, dass der Zugriff auf die Daten einen Hot Spot aufweist, d. h. auf einen kleinen Teil der Daten wird sehr intensiv zugegriffen. Ziel bei CacheCade 2.0 ist es, diesen Hot Spot auf den SSDs zu speichern und somit beim überwiegenden Teil der Zugriffe die hohen Transaktionsraten der SSDs zu erreichen. Beim Zugriff auf die Daten wird sich über die Zeit eine Transaktionsrate einstellen, die ausgehend vom Niveau des reinen HDD-Verbandes das Niveau des reinen SSD-Verbandes erreicht. Im Idealfall würde man Folgendes beobachten: Transaction rate [IO/s] Idealer Verlauf der Transaktionsraten über die Zeit Transaction rateHDD-Verband HDD array Transaktionsrate Transaktionsrate Transaction rateCacheCade CacheCade Transaktionsrate Transaction rateSSD-Verband SSD array Zeit Der HDD-Verband hat eine in Relation zu den SSDs geringe Transaktionsrate. Im Laufe der Datenzugriffe wird der Hot Spot nach und nach im CacheCade 2.0 Cache, also auf den SSDs, gespeichert, und man profitiert von der relativ hohen Transaktionsrate der SSDs. Im Idealfall erreicht man die Transaktionsrate eines entsprechenden Verbandes aus SSDs. Hot Spot Eine wesentliche Voraussetzung für CacheCade 2.0 ist, wie bereits erwähnt, ein Hot Spot beim wahlfreien Datenzugriff. Diesen als solchen zu erkennen und die Größe abzuschätzen ist einer der ersten Schritte für die Planung von CacheCade 2.0 Cache. Neben dem Zugriff auf den Hot Spot sind andere Zugriffe möglich, allerdings sollte der Anteil der Zugriffe auf den Hot Spot 85% oder mehr betragen. Ein Hot Spot darf sich auch über die Zeit verlagern, wobei sich im Übergang natürlich geringere Transaktionsraten einstellen. Ein Hot Spot sollte nicht allzu groß sein und zur CacheCade 2.0 Cache Größe passen. Es hat sich gezeigt, dass Hot Spots bis 100 GB besonders effektiv gepuffert werden können und der Cache mindestens doppelt so groß wie der Hot Spot sein sollte. Transaktionsratengewinn Ein weiterer wichtiger Aspekt bei CacheCade 2.0 ist die Differenz der Transaktionsraten des HDD- und des SSD-Verbandes. Ist sie relativ groß, wird der Einsatz von CacheCade 2.0 besonders effektiv ausfallen. Ist der HDD-Verband dagegen bereits für eine hohe Transaktionsrate ausgelegt, z. B. durch eine große Anzahl von HDDs, wird die Differenz gering ausfallen. Im Abschnitt „RAID 0 mit 24 SAS-6G-HDDs“ findet man z. B. für das Standardlastprofil Database eine Transaktionsrate von ca. 14000 IO/s. Das entspricht ziemlich genau der Transaktionsrate einer SAS-6GSSD, wie dem Kapitel „Messumgebung“ zu entnehmen ist. Daraus kann man ableiten, dass eine derartige Konfiguration bei CacheCade 2.0 keinen Vorteil bedeutet. http://www.fujitsu.com/de/primergy Seite 47 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Es ist im Einzelfall abzuschätzen, ob eine Steigerung zu erwarten ist und ob ggf. auch eine geringe Steigerung der Transaktionsrate die Anforderungen erfüllt. Zeitfaktor Letztlich ist der Zeitfaktor von Interesse, d. h. wie lange es dauert, bis CacheCade 2.0 höhere Transaktionsraten liefert. Bei einem kleinen Hot Spot kann sich dies in wenigen Minuten einstellen. Bei einer großen Datenmenge oder einem HDD-Verband mit geringer Transaktionsrate kann es aber auch einige Stunden dauern. Die Dauer des Übergangs in obigem Schaubild wird also von mehreren Faktoren beeinflusst. Je größer der Hot Spot ist, desto länger wird es dauern ihn in den CacheCade 2.0 Cache zu übertragen. Bei einem leistungsfähigen HDD-Verband können die Daten in einer kürzeren Zeit übertragen werden. Letztlich hat es auch einen Einfluss, mit welcher Intensität zugegriffen wird, d. h. ob die maximale Transaktionsrate des HDD-Verbandes genutzt wird. Auch hier ist im Einzelfall und unter Berücksichtigung der Anforderungen zu beurteilen, wie lange es dauern darf. Beispiel: vier SATA-HDDs RAID 0 und zwei SAS-SSDs RAID 1 Eine typische Konfiguration für CacheCade 2.0 wäre die Kombination aus vier SATA-HDDs als RAID 0 und zwei SAS-SSDs als RAID 1. Beide Konfigurationen und deren Transaktionsraten sind in diesem Dokument unter „RAID 0 und 10 (vier SATA-Festplatten)“ und „RAID 1 (zwei SAS-Festplatten)“ ausführlich beschrieben. Die vier SATA-6G-HDDs stellen mit RAID 0 insgesamt ca. 4 TB Speicherplatz zur Verfügung. Die beiden SAS-6G-SSDs haben mit RAID 1 ca. 200 GB. Die folgende Darstellung zeigt die Transaktionsraten, die sich über die Zeit ergeben, wenn mit dem Lastprofil „File copy“ über CacheCade 2.0 auf einen Hot Spot von 32 GB, 64 GB und 128 GB zugegriffen wird. CacheCade 2.0 mit Lastprofil „File copy“ und Hot Spots 4000 Transaction rate [IO/s] 3500 3000 SSD array SSD-Verband 2500 CacheCade 2.0 2.0 -- 32 32 GB GB HotSpot Hot Spot CacheCade CacheCade 2.0 2.0 -- 64 64 GB GB HotSpot Hot Spot CacheCade 2000 CacheCade 2.0 2.0 - 128 GB HotSpot Hot Spot CacheCade 1500 HDD-Verband HDD array 1000 500 0 Zeit In der Praxis wird die maximale Transaktionsrate der SSDs nicht erreicht, da ein gewisser Overhead für CacheCade 2.0 berücksichtigt werden muss. Sehr gute Ergebnisse werden bei einem Hot Spot von 32 GB erreicht. Bei einem Hot Spot von 64 GB sind die Transaktionsraten deutlich höher als beim HDD-Verband, erreichen aber nicht mehr das Niveau der SSDs. Bei einem Hot Spot von 128 GB ist zu erkennen, dass die Transaktionsrate nur sehr langsam steigt und es eine erhebliche Zeit erfordert, bis der Transaktionsrate des HDD-Verbandes überschritten wird. Seite 48 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 In der vorangegangenen Messung wurde das Lastprofil „File copy“ als Repräsentant gewählt. Mit der vereinfachten Annahme, dass auf genau 32 GB der Daten zugegriffen wird, stellen sich die maximalen Transaktionsraten für die drei Standardlastprofile „File copy“, „File server“ und „Database“ wie folgt dar. Maximale Transaktionsraten, 4 SATA-6G-HDDs RAID 0, 2 SAS-6G-SSDs RAID 1 bei verschiedenen Lastprofilen 22000 20000 16000 14000 12000 10000 SSD-Array CacheCade 2.0 HDD-Array SSD-Array CacheCade 2.0 2000 HDD-Array 4000 HDD-Array 6000 SSD-Array 8000 CacheCade 2.0 Transaction rate [IO/s] 18000 0 File copy File server Database Die Messwerte beziehen sich auf den LSI2208-1G-Controller. Der HDD-Verband besteht aus vier SATA-6GHDDs als RAID 0 und der CacheCade 2.0 Cache aus zwei SAS-6G-SSDs als RAID 1. Der CacheCade 2.0 Cache ist für Schreiben und Lesen konfiguriert. Dargestellt sind die jeweils maximal erreichbaren Transaktionsraten. Für den Zugriff auf die Daten wurde ein Hot Spot von 32 GB angenommen. http://www.fujitsu.com/de/primergy Seite 49 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 FastPath Aus dem Bereich großer Festplattenanzahlen wurden im Unterkapitel „RAID 0 und 10 (mehr als acht Festplatten)“ die Konfiguration RAID 0 mit 24 SAS-6G-SSDs näher untersucht und dargestellt. Für wahlfreie Zugriffe werden hier die höchsten Transaktionsraten erreicht und es bietet sich ein Vergleich mit FastPath an. RAID 0 mit 24 SAS-6G-SSDs und FastPath Die nächste Grafik stellt die mit den verschiedenen Controllern erreichbaren Transaktionsraten des SSDVerbandes für RAID 0 bei wahlfreien Lastprofilen dar. Die drei Säulengruppen zeigen die Transaktionsraten für die Standardlastprofile „File copy“ (wahlfreier Zugriff, 50% read, 64 kB Blockgröße), „File server“ (wahlfreier Zugriff, 67% read, 64 kB Blockgröße) und „Database“ (wahlfreier Zugriff, 67% read, 8 kB Blockgröße). Basierend auf den schon im Kapitel „Controller-Vergleich“ vorgestellten Messergebnissen wurden hier die Resultate für den LSI2208-1G-3.0-Controller in Kombination mit FastPath ergänzt. Maximale Transaktionsraten, wahlfreier Zugriff, RAID 0, 24 SAS-6G-SSDs, 1 CPU-Thread (Standardmessverfahren) 180000 160000 LSI2208-1G-3.0 FastPath LSI2208-1G 20000 LSI2108 40000 LSI2108 60000 LSI2208-1G-3.0 FastPath 80000 LSI2208-1G 100000 LSI2108 120000 LSI2208-1G-3.0 FastPath 140000 LSI2208-1G Transaction rate [IO/s] 200000 0 File copy File server Database Die beiden Lastprofile „File copy“ und „File server“ repräsentieren Anwendungen mit einer Blockgröße von 64 kB. Wie bereits erwähnt werden dabei trotz relativ geringer Transaktionsraten vom LSI2208-1G-Controller hohe Datendurchsätze von über 3000 MB/s erreicht, die eine Leistungsbegrenzung darstellen. Mit FastPath wird somit keine Steigerung erreicht. Das Lastprofil „Database“ repräsentiert Anwendungen mit einer Blockgröße von 8 kB. Bei rund 168000 IO/s beträgt der Durchsatz ca. 1310 MB/s und ist nicht im Grenzbereich. Bereits mit dem Standardmessverfahren zeigt sich durch FastPath beim Lastprofil „Database“ eine Performance-Steigerung. Wie im Kapitel „Messverfahren“ beschrieben, wird zur Modellierung parallel zugreifender Anwendungen die „# of outstanding I/Os“ verwendet. Im Standardmessverfahren mit Iometer wird diese Anzahl innerhalb genau eines lasterzeugenden CPU-Threads pro RAID-Verband variiert. Bei ca. 200000 I/Os kommt es dabei zu der Situation, dass ein CPU-Thread des Servers zu 100% ausgelastet ist. Falls sich reale Anwendungen ähnlich verhalten, d. h. die gesamte IO-Last durch einen CPU-Thread abwickeln, werden ebenfalls maximal 200000 IO/s erreicht und FastPath wird keine Steigerung bewirken. Seite 50 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Typischerweise werden bei Anwendungen mit hohen Transaktionsraten, wie z. B. bei StandardDatenbanken, die Zugriffsaktivitäten aber auf mehrere CPU-Threads aufgeteilt. Dementsprechend wird die Modellierung der Anwendung „Database“ angepasst und innerhalb von Iometer auf vier CPU-Threads aufgeteilt. Als Ergänzung zur Blockgröße von 8 kB wird auch die Blockgröße 4 kB betrachtet. Mit noch kleineren Blockgrößen könnte man eine höhere Transaktionsrate erreichen. Kleinere Blockgrößen als 4 kB sind aber eher untypisch. Gegenüber den Standardeinstellungen des Modus‘ „Performance“ von ServerView RAID wird der ServerView RAID Modus‘ „Fast Path optimum“ verwendet, wie es ServerView RAID vorgibt. Dieser beinhaltet derzeit folgende Einstellungen: Read Mode „No read-ahead“ Write Mode „Write-through“ Cache Mode “Direct” Disk Cache “Enabled” Die folgende Grafik zeigt die Transaktionsraten des Controllers LSI2208-1G-3.0 für das Lastprofil „Database“ mit 4 kB und 8 kB Blockgröße, wenn mehrere CPU-Threads genutzt werden. Maximale Transaktionsraten, wahlfreier Zugriff, RAID 0, 24 SAS-6G-SSDs, vier CPU-Threads 360000 320000 160000 120000 80000 40000 LSI2208-1G-3.0 FastPath 200000 LSI2208-1G-3.0 240000 LSI2208-1G-3.0 FastPath 280000 LSI2208-1G-3.0 Transaction rate [IO/s] 400000 0 Database 4 kB block size Database 8 kB block size Der Transaktionsrate des Controllers LSI2208-1G-3.0 ohne FastPath liegt bei 4 kB und 8 kB nahe 190000 IO/s. Daraus lässt sich schließen, dass der Controller und nicht die CPU des Systems limitierend wirken, da in der vorhergehenden Grafik mit nur einem CPU-Thread bereits ca. 170000 IO/s erreicht wurden. Im Gegensatz dazu werden mit FastPath Transaktionsraten über 360000 IO/s erreicht, wenn Blockgrößen von 4 kB zum Einsatz kommen, Anwendungen mit 8 kB Blockgröße zeigen mit FastPath ebenfalls eine Steigerung bis 240000 IO/s, sind dann aber mit einem Durchsatz von ca. 1900 MB/s auf der SAS-Seite begrenzt. Das hier aufgezeigte Lastprofil „Database“ verwendet einen Schreibanteil von 33%. Es ist durchaus denkbar, dass Anwendungen einen geringeren Schreibanteil verwenden oder der Zugriff mit einer 1 kB oder 2 kB Blockgröße erfolgt. In solchen Fällen können die absoluten Transaktionsraten auch deutlich über 400000 IO/s liegen. http://www.fujitsu.com/de/primergy Seite 51 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Fazit Mit dem „Modular RAID“ Konzept bieten die PRIMERGY Server eine Fülle von Möglichkeiten, um den Anforderungen verschiedener Anwendungsszenarien gerecht zu werden. Ein Onboard-Controller ist eine kostengünstige Einstiegsalternative für die RAID-Levels 0, 1 und 10, die einen PCIe-Steckplatz spart, aber auf vier Festplatten beschränkt ist. Der anteilige Konsum von Prozessorleistung des Servers fällt bei neueren Servern immer weniger ins Gewicht. Die derzeitigen Onboard-Controller unterstützen SATA-/SAS-seitig die Standards bis zur Frequenz 3G. Bei modernen SAS-6G-SSDs ist zur Erreichung bestmöglicher Durchsätze auch ein Controller mit SAS-6GSchnittstelle erforderlich. Dies würde z. B. für eine PRIMERGY BX920 S3 bedeuten, dass nicht der „Onboard Intel C600 SAS RAID“-Controller benutzt werden sollte, sondern z. B. der “PY SAS RAID HDD Module“-Controller (LSI2208-512). Die „SAS 0/1“-RAID-Controller ohne Controller-Cache unterstützen die Basis-RAID-Lösungen RAID 0, RAID 1 und RAID 1E bzw. RAID 10, und liefern bei diesen RAID-Levels eine gute Performance. Einzig der „RAID 0/1 SAS based on LSI MegaRAID 8Port“-Controller (LSI1068) aus der Vorgängergeneration unterstützt nur sequentielle Durchsätze bis etwa 800 MB/s. Werden höhere Durchsätze benötigt, ist ein geeigneter aktueller Controller zu benutzen. Im High-End-Bereich bieten die „SAS 5/6“-RAID-Controller alle heute gängige RAID-Lösungen RAID 0, RAID 1, RAID 5, RAID 6, RAID 10, RAID 50 und RAID 60 an. Diese Controller haben einen Controller-Cache und können optional mit einer BBU/FBU gesichert werden. Vielfältige Möglichkeiten, die Nutzung des Caches einzustellen, erlauben eine flexible Anpassung der Controller-Leistung an den verwendeten RAIDLevel. In manchen Anwendungsszenarien, beispielsweise wenn wahlfreie Zugriffe auf konventionellen Festplatten mit hoher Belastungsintensität stattfinden, ermöglichen diese Controller eine um 70% höhere Transaktionsrate als die „SAS 0/1“-RAID-Controller. Die derzeitigen „SAS 5/6“-RAID-Controller lassen sich entsprechend der Technologiefortschritte in drei Gruppen gliedern: Die erste Gruppe basiert auf dem Chip LSI SAS2108, die zweite Gruppe basiert auf dem Chip LSI SAS2208 in der Ausprägung für PCIe 2.0, und die dritte Gruppe basiert auf dem Chip LSI SAS2208 in der Ausprägung für PCIe 3.0. Die erste Gruppe enthält den „RAID Ctrl SAS 6G 5/6 512 MB (D2616)“- und den „PY SAS RAID Mezz Card 6Gb“-Controller. Die zweite Gruppe enthält den „RAID Ctrl SAS 6G 5/6 1GB (D3116)“-, den „PY SAS RAID HDD Module“- und den „PY SAS RAID HDD Module w/o cache“-Controller. Die dritte Gruppe enthält den „RAID Ctrl SAS 6G 5/6 1GB (D3116C)“-, den „PY SAS RAID HDD Module 3.0“- und den „PY SAS RAID HDD Module w/o cache 3.0“-Controller. Die Mehrzahl der Anwendungsszenarien, die das Disk-Subsystem beanspruchen, sind mit einem wahlfreien Schreib-/Lesezugriff verbunden. Wenn zur Bewältigung sehr hoher IO-Raten SSDs verwendet werden, hat der Controller einen erheblichen Einfluss auf die maximale Transaktionsrate. So ermöglicht beispielsweise der „RAID Ctrl SAS 6G 5/6 1GB (D3116)”-Controller (LSI2208-1G) gegenüber der ersten Gruppe teilweise fast eine Verdreifachung der maximalen Transaktionsrate. Daher ist für jeden geplanten Einsatzfall mit mehr als vier SSDs pro Controller für das jeweilige Lastprofil und den geplanten RAID-Verband anhand der Grafiken im Kapitel „Controller-Vergleich“ zu prüfen, ob der „RAID Ctrl SAS 6G 5/6 512 MB (D2616)”Controller (LSI2108) noch ausreicht, oder ob ein neuerer Controller zu benutzen ist. Unabhängig vom Festplattentyp haben die verschiedenen Controller jeweils maximale sequentielle Datendurchsätze, die spezifisch für den RAID-Level und das Lastprofil sind. Auch diese Maximalwerte haben sich zwischen den drei Gruppen der „SAS 5/6“-RAID-Controller teilweise erheblich gesteigert, beispielsweise bei RAID 5 und sequentiellem Lesen: von 1700 MB/s in der ersten Gruppe über 2500 MB/s in der zweiten Gruppe schließlich auf 3800 MB/s in der dritten Gruppe. Wenn für das geplante Anwendungsszenario eine höhere Transaktionsrate oder ein höherer Durchsatz benötigt wird, als ein einzelner Controller liefern kann, können zwei Controller benutzt werden. Einige PRIMERGY Server bieten diese Möglichkeit (z. B. PRIMERGY TX300 S7). Ein weiterer Aspekt der schnelleren Controller bei sequentiellen Zugriffsprofilen ist der erhöhte Durchsatz bereits bei geringer Parallelität der Zugriffe. Sofern der RAID-Verband leistungsfähig genug ist, bedeutet dies in diesem speziellen Anwendungsfall, dass beim Lesen und beim Schreiben mit dem „RAID Ctrl SAS 6G 5/6 1GB (D3116)“-Controller (LSI2208-1G) über 900 MB/s möglich sind. Auch für diese Spezialfälle bedeutet das eine deutliche Steigerung der maximalen Durchsätze gegenüber den Controllern der Vorgängergeneration. Seite 52 (54) http://www.fujitsu.com/de/primergy White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Obwohl MegaRAID Advanced Software Options die zwei Funktionen CacheCade 2.0 und FastPath umfasst, wird man sie nicht gleichzeitig am selben Controller nutzen, da sie unterschiedliche Optimierungsansätze verfolgen. CacheCade 2.0 beschleunigt wahlfreie Zugriffe auf HDD-Verbände, die eine gewisse Mindestgröße haben sollten. Konfigurationen mit einer HDD und einer SSD sind wenig sinnvoll. Andererseits ist zu beachten, dass große HDD-Verbände bereits eine hohe Transaktionsrate erzielen können und u. U. kein Gewinn durch den CacheCade 2.0 Cache zu erwarten ist. Besonders effektiv ist CacheCade 2.0, wenn auf einen kleinen Teilbereich (Hot Spot) von 32 GB bis 64 GB der Daten zugegriffen wird. FastPath ist im Gegensatz CacheCade 2.0 für den Einsatz bei hohen Transaktionsraten konzipiert, wie sie bei SSD-Verbänden auftreten. Wenn in einer Konfiguration eine maximale Transaktionsrate von 200000 IO/s nicht überschritten wird, SSDs aber noch ausreichend Reserven haben und die SAS-Ressourcen noch nicht ausgeschöpft sind, dann kann man mit FastPath die Transaktionsrate steigern. Zur Konfiguration von Controllern und Festplatten empfiehlt sich die für PRIMERGY Server mitgelieferte RAID-Manager-Software „ServerView RAID“. Dieses Dienstprogramm ermöglicht Controller-unabhängig für die Mehrzahl der Anwendungsszenarien eine komfortable Anpassung der Controller- und Festplatteneinstellungen an die kundenseitigen Erfordernisse bezüglich Performance und Datensicherheit. Bei Verwendung von BBUs/FBUs und USVen als Puffer bei Stromausfällen lässt sich die maximale Performance mit Datensicherheit vereinbaren. http://www.fujitsu.com/de/primergy Seite 53 (54) White Paper RAID-Controller Performance 2013 Version: 2.0a 2013-08-01 Literatur PRIMERGY Systeme http://primergy.de/ PRIMERGY Performance http://www.fujitsu.com/de/products/computing/servers/primergy/benchmarks/ Dieses White Paper: http://docs.ts.fujitsu.com/dl.aspx?id=e2489893-cab7-44f6-bff2-7aeea97c5aef http://docs.ts.fujitsu.com/dl.aspx?id=71fac54b-7ec3-4b3f-b13d-f80fbb42d583 http://docs.ts.fujitsu.com/dl.aspx?id=e34159fa-0196-4a01-99ff-8792b5f644eb RAID-Controller-Performance (Vorgänger White Paper, bis zum Jahre 2011) http://docs.ts.fujitsu.com/dl.aspx?id=de84ef99-1057-45cc-825e-17bd1708bd66 Performance einzelner Festplatten http://docs.ts.fujitsu.com/dl.aspx?id=664c076d-f57b-4dcc-beeb-c40451554d92 Grundlagen Disk-I/O-Performance http://docs.ts.fujitsu.com/dl.aspx?id=3d4fbad8-2a7e-465f-b9ee-d43b711f636d Informationen über Iometer http://www.iometer.org Kontakt FUJITSU Website: http://www.fujitsu.com/de/ PRIMERGY Product Marketing mailto:[email protected] PRIMERGY Performance und Benchmarks mailto:[email protected] © Copyright 2013 Fujitsu Technology Solutions. Fujitsu und das Fujitsu Logo sind Handelsnamen und/oder eingetragene Warenzeichen von Fujitsu Ltd. in Japan und anderen Ländern. Andere Firmen-, Produkt- und Servicebezeichnungen können Marken oder eingetragene Marken der jeweiligen Eigentümer sein. Änderung von technischen Daten sowie Lieferbarkeit vorbehalten. Haftung oder Garantie für Vollständigkeit, Aktualität und Richtigkeit der angegebenen Daten und Abbildungen ausgeschlossen. Wiedergegebene Bezeichnungen können Marken und/oder Urheberrechte sein, deren Benutzung durch Dritte für eigene Zwecke die Rechte der Inhaber verletzen kann. Weitere Einzelheiten unter http://www.fujitsu.com/de/resources/navigation/terms-of-use.html 2013-08-01 WW DE Seite 54 (54) http://www.fujitsu.com/de/primergy