Best Practices

Transcription

Best Practices
KINGSTON.COM
Best Practices
Leistungsbenchmark Serverlösungen
Speicherkanäle, Taktgeschwindigkeit und Leistung
Auch wenn es den meisten Personen nicht bewusst ist, all die verschiedenen
Datenbankarten, die weltweit verwendet werden, haben eine Sache gemeinsam –
sie benötigen Speicher mit hoher Leistungskraft, damit Daten schnell und zuverlässig
geliefert werden können.
Vom telefonischen Weckruf durch die Kundendatenbank unseres Mobilfunkanbieters,
über die elektronische Bezahlung unserer wöchentlichen Einkäufe durch die
Transaktionsdatenbank unserer Bank bis hin zu Filmempfehlungen aus einer auf unseren
Vorlieben beruhenden Datenbank und das Streamen von Filmen spät in der Nacht
– all diese Dienstleistungen erfordern gleichbleibend schnelle und leistungsfähige
Datenbanken, die mit dynamischer Anpassung den täglichen Kundenanfragen und
-anforderungen gerecht werdenkönnen.
Die Bereitstellung von Daten in konstanter Leistung und Transaktionsintegrität ist
keine einfache Aufgabe und erfordert von In-Memory-Datenbanken oftmals, vielen
Benutzern zur selben Zeit Empfehlungen zu geben und nahezu gleichzeitig relationale
Daten bereitzustellen.
Die Leistung von In-Memory-Datenbanken (IMDB) hängt hauptsächlich von der
Verwendung von DRAM (Dynamic Random Access Memory) mit hoher Kapazität und
– am wichtigsten – hoher Leistung ab.
Diese können hohe Anfragevolumina bis zu x-mal schneller bedienen als Datenbanken
auf herkömmlicher Festplattenbasis, dienen als Backbone in jedem Szenario, das
schnelle Reaktionszeiten bei der Datenabfrage erfordert und können als Ergänzung zu
Big-Data-Anwendungen verwendet werden.
DDR3 SDRAM (Double Data Rate Synchronous Dynamic Random Access
Memory) DIMM-Speicher (Dual In-line Memory Module) gibt es in verschiedenen
Speicherkapazitäten und Geschwindigkeiten.
Die Geschwindigkeit eines Speichermoduls wird auch oft als Speicherfrequenz
bezeichnet und in Megahertz (MHz) angegeben.
Speicherfrequenzen wirken sich direkt auf die Leistung von Speichern aus - die
Speicherleistung steigert sich im selben Umfang, in dem die Speicherfrequenz erhöht
wird.
Aber natürlich ist DRAM nur ein Teilstück optimaler Leistung des Speicher-Subsystems.
Zur Verwaltung des Speicher-Subsystems ist ein Memory-Controller erforderlich. Die
unterschiedlichen Bestückungsregeln, mit denen der Memory-Controller gesteuert
Best Practices Leistungsbenchmark Serverlösungen
wird, wirken sich bei der Ansteuerung des Speichermoduls auf Frequenz, Geschwindigkeit
und Latenzzeiten aus.
Neuere Memory-Controller-Generationen sind zum Erreichen der besten Leistung in die
Prozessoren eingebettet. Es muss jedoch beachtet werden, das einige Memory-Controller
das Speicher-Subsystem nur mit einer maximalen Bandbreite von 800MHz betreiben
können.
Durch Verwendung der in Intel® Romley Plattformen verfügbaren 24 DIMM (Dual Inline
Memory Module) Sockel, die mit dem Speicher-Subsystem der Intel Xeon E5-Familie
verbunden sind, können wir die dauerhafte Speicherbandbreite in verschiedenen
Speicherkonfigurationen messen. Diese Messung wird mit dem integrierten STREAMSpeicher-Benchmark SiSoft Sandra 2012 mit unterschiedlichen Kanalbestückungen und
Speicher-Taktgeschwindigkeiten durchgeführt.
Die Intel Xeon E5-Familie hat verschiedene Leistungsverbesserungen gegenüber
der vorhergehenden Generation der Xeon 5500 und Xeon 5600 Serverprozessoren,
einschließlich der beiden, in dieser Studie behandelten, wichtigen leistungsbezogenen
Upgrades: Adressierung von Quad-Channel-Speichern, und Unterstützung für 1600 MHz
(Megahertz) DDR3 (Double Data Rate) Speichergeschwindigkeiten mit schnellerer 8GT/s
(GigaTransfer pro Sekunde) QuickPath Interconnect (QPI) Microarchitektur, zum Vorteil der
verfügbaren Verbindungsbandbreite für die verringerte Latenz zum Speicher-Array.
Speicherkanalbestückung und Leistung
Abb. 1. Leistung von Kanalbestückungen gemessen mit SiSoft Sandra 2012
Testkonfiguration beinhaltete SiSoftware Sandra 2012 Speicherbenchmark auf Intel Romley Plattform S2600GZ mit zwei Xeon
E5-2665 2.40GHz Prozessoren und 64GB Speicher (2 x KVR16R11D4K4/32 @1600 MHz). CPU Hyperthreading und Energiesparen
deaktiviert.
Best Practices Leistungsbenchmark Serverlösungen
Wie in Abbildung 1 zu sehen ist, erhöht sich die Leistung des Speicher-Subsystems nahezu
linear von der langsamsten zur schnellste Konfiguration; d. h. von einem Single-ChannelSpeicher auf jedem Xeon Prozessor Memory-Controller, bestückt mit einem 8GB DDR3
1600 MHz Single-Speichermodul, zum schnellsten Speicher-Subsystem mit einem QuadChannel (auch als 1 DIMM je Kanal (DPC) bekannt), in dem jeder Speichersockel in der ersten
verfügbaren Speicherbank jedes Prozessors mit vier 8GB 1600 MHz-Speichermodulen
bestückt ist.
Selbst bei der erhöhten elektrischen Last der Quad-Channel-Konfiguration (1 DPC), kann
eine nahezu vierfache Steigerung der Speicherleistung im Subsystem auf ~70GB/s im
Vergleich zu einer Single-Channel-Konfiguration beobachtet werden – eine Ideallösung
für Anwendungen, die hohe Leistung für ressourcenintensive Anwendungen wie IMDB
erfordern.
Speicherfrequenz und Leistung
Abb. 2. Leistung der Speicherfrequenz gemessen mit SiSoft Sandra 2012
Testkonfiguration beinhaltete SiSoftware Sandra 2012 Speicherbenchmark auf Intel Romley Plattform S2600GZ mit zwei Xeon
E5-2665 2.40GHz Prozessoren und 192GB Speicher (2 x KVR16R11D4K4/32). CPU Hyperthreading und Energiesparen deaktiviert.
In Abbildung 2 verwenden wir dieselben 8GB DDR3 Speichermodule, die mit vier
unterschiedlichen Speichergeschwindigkeiten (MHz) symmetrisch über beide SpeicherSubsystemen der Intel Xeon E5-Familie laufen, um eine ausbalancierte Konfiguration zu
Best Practices Leistungsbenchmark Serverlösungen
erreichen und um die bestmögliche Leistung in allen Speichergeschwindigkeiten zu
erzielen.
Wenn die Speichermodule mit 800 MHz laufen, liegt die niedrigste Leistung bei ~40GB/s
dauerhafter Übertragungsgeschwindigkeit, gemessen mit dem integrierten STREAMSpeicher-Benchmark SiSoft Sandra 2012.
Während dem Höherskalieren der Frequenz können wir eine nahezu lineare Steigerung
der Speicherleistung auf maximale ~70GB/s bei einer Geschwindigkeit von 1600 MHz
erkennen. Ideal für Szenarios, bei denen in den Speicher geschriebene Ressourcen die
höchstmögliche Leistung erfordern, um effizient zu bleiben.
Speicherkapazitäten im Verhältnis zur Frequenzleistung
Abb. 3. Speicherkapazitäten im Verhältnis zur Frequenzleistung gemessen mit SiSoft Sandra
2012
Testkonfiguration beinhaltete SiSoftware Sandra 2012 Speicherbenchmark auf Intel Romley Plattform S2600GZ mit zwei Xeon E52665 2.40GHz Prozessoren und 192GB Speicher (KVR16R11D4K4/32). CPU Hyperthreading und Energiesparen deaktiviert.
Zum Abschluss unserer Untersuchungen von Speicherleistungen sehen wir uns in
Abbildung 3 die Leistung eines Speicher-Subsystems an, einmal bei Bestückung mit
einem 192GB und 1066 MHz Speicher und einmal bei Bestückung mit 128GB bzw. 64GB,
mit jeweils 1600 MHz.
Die erhöhten Speicherkapazitäten, die mit symmetrisch über beide Speicher-Subsysteme
Best Practices Leistungsbenchmark Serverlösungen
verteilten 128GB (16x 8GB) oder 64GB (8x 8GB) und mit jeweils 1600 MHz laufen, zeigen
ungefähr dieselbe ~70GB/s Dauerleistung.
Obgleich die höhere 192GB Speicherkapazität (24x 8GB) mit niedrigeren 1066 MHz läuft,
zeigt sie als Ausgleich für die erhöhte Speicherkapazität einen geringfügigen Abfall von
~17GB/s in der Dauerleistung.
Zusammenfassung
Wenn wir die spezifischen Regeln für die Speicherkanalbestückung von Serverprozessor
und Memory-Controller einhalten, können wir die richtige Balance in der Optimierung
unseres Speichers mit einfachen Schritten erreichen, z.B. durch die Bestückung aller vier
Speicherkanäle. Durch die bis zu vierfache Erhöhung der Speicherleistung können die
Rentabilität und ROI erhöht und gleichzeitig die Gesamtbetriebskosten (TCO) während
der Lebensdauer des Servers reduziert werden.
Referenzen
[1] Predicting User Preference for Movies using NetFlix database, Department of Electrical
and Computer Engineering Carnegie Mellon University (Vorausberechnung von
Benutzerpräferenzen für Filme unter Verwendung der NetFlix Datenbank, Department of
Electrical and Computer Engineering Carnegie Mellon University)
http://users.ece.cmu.edu/~dbatra/publications/assets/goel_batra_netflix.pdf
[2] SiSoft Sandra Q & A - Memory Benchmark, SiSoftware
http://www.sisoftware.co.uk/?d=qa&f=ben_mem&l=en&a=
[3] Intel® Xeon® Prozessor E5-2600 Produktfamilie News Datenblatt, Intel®
http://download.intel.com/newsroom/kits/xeon/e5/pdfs/Intel_Xeon_E5_Factsheet.pdf
© 2013 Kingston Technology Europe Ltd und Kingston Digital Europe Ltd, Kingston Court, Brooklands Close, Sunbury-on-Thames, Middlesex,
TW16 7EP, England. Tel: +44 (0) 1932 738888, Fax: +44 (0) 1932 785469. Alle Rechte vorbehalten. Alle Marken und eingetragenen Marken sind
Eigentum ihrer jeweiligen Besitzer. MKF-549