Best Practices
Transcription
Best Practices
KINGSTON.COM Best Practices Leistungsbenchmark Serverlösungen Speicherkanäle, Taktgeschwindigkeit und Leistung Auch wenn es den meisten Personen nicht bewusst ist, all die verschiedenen Datenbankarten, die weltweit verwendet werden, haben eine Sache gemeinsam – sie benötigen Speicher mit hoher Leistungskraft, damit Daten schnell und zuverlässig geliefert werden können. Vom telefonischen Weckruf durch die Kundendatenbank unseres Mobilfunkanbieters, über die elektronische Bezahlung unserer wöchentlichen Einkäufe durch die Transaktionsdatenbank unserer Bank bis hin zu Filmempfehlungen aus einer auf unseren Vorlieben beruhenden Datenbank und das Streamen von Filmen spät in der Nacht – all diese Dienstleistungen erfordern gleichbleibend schnelle und leistungsfähige Datenbanken, die mit dynamischer Anpassung den täglichen Kundenanfragen und -anforderungen gerecht werdenkönnen. Die Bereitstellung von Daten in konstanter Leistung und Transaktionsintegrität ist keine einfache Aufgabe und erfordert von In-Memory-Datenbanken oftmals, vielen Benutzern zur selben Zeit Empfehlungen zu geben und nahezu gleichzeitig relationale Daten bereitzustellen. Die Leistung von In-Memory-Datenbanken (IMDB) hängt hauptsächlich von der Verwendung von DRAM (Dynamic Random Access Memory) mit hoher Kapazität und – am wichtigsten – hoher Leistung ab. Diese können hohe Anfragevolumina bis zu x-mal schneller bedienen als Datenbanken auf herkömmlicher Festplattenbasis, dienen als Backbone in jedem Szenario, das schnelle Reaktionszeiten bei der Datenabfrage erfordert und können als Ergänzung zu Big-Data-Anwendungen verwendet werden. DDR3 SDRAM (Double Data Rate Synchronous Dynamic Random Access Memory) DIMM-Speicher (Dual In-line Memory Module) gibt es in verschiedenen Speicherkapazitäten und Geschwindigkeiten. Die Geschwindigkeit eines Speichermoduls wird auch oft als Speicherfrequenz bezeichnet und in Megahertz (MHz) angegeben. Speicherfrequenzen wirken sich direkt auf die Leistung von Speichern aus - die Speicherleistung steigert sich im selben Umfang, in dem die Speicherfrequenz erhöht wird. Aber natürlich ist DRAM nur ein Teilstück optimaler Leistung des Speicher-Subsystems. Zur Verwaltung des Speicher-Subsystems ist ein Memory-Controller erforderlich. Die unterschiedlichen Bestückungsregeln, mit denen der Memory-Controller gesteuert Best Practices Leistungsbenchmark Serverlösungen wird, wirken sich bei der Ansteuerung des Speichermoduls auf Frequenz, Geschwindigkeit und Latenzzeiten aus. Neuere Memory-Controller-Generationen sind zum Erreichen der besten Leistung in die Prozessoren eingebettet. Es muss jedoch beachtet werden, das einige Memory-Controller das Speicher-Subsystem nur mit einer maximalen Bandbreite von 800MHz betreiben können. Durch Verwendung der in Intel® Romley Plattformen verfügbaren 24 DIMM (Dual Inline Memory Module) Sockel, die mit dem Speicher-Subsystem der Intel Xeon E5-Familie verbunden sind, können wir die dauerhafte Speicherbandbreite in verschiedenen Speicherkonfigurationen messen. Diese Messung wird mit dem integrierten STREAMSpeicher-Benchmark SiSoft Sandra 2012 mit unterschiedlichen Kanalbestückungen und Speicher-Taktgeschwindigkeiten durchgeführt. Die Intel Xeon E5-Familie hat verschiedene Leistungsverbesserungen gegenüber der vorhergehenden Generation der Xeon 5500 und Xeon 5600 Serverprozessoren, einschließlich der beiden, in dieser Studie behandelten, wichtigen leistungsbezogenen Upgrades: Adressierung von Quad-Channel-Speichern, und Unterstützung für 1600 MHz (Megahertz) DDR3 (Double Data Rate) Speichergeschwindigkeiten mit schnellerer 8GT/s (GigaTransfer pro Sekunde) QuickPath Interconnect (QPI) Microarchitektur, zum Vorteil der verfügbaren Verbindungsbandbreite für die verringerte Latenz zum Speicher-Array. Speicherkanalbestückung und Leistung Abb. 1. Leistung von Kanalbestückungen gemessen mit SiSoft Sandra 2012 Testkonfiguration beinhaltete SiSoftware Sandra 2012 Speicherbenchmark auf Intel Romley Plattform S2600GZ mit zwei Xeon E5-2665 2.40GHz Prozessoren und 64GB Speicher (2 x KVR16R11D4K4/32 @1600 MHz). CPU Hyperthreading und Energiesparen deaktiviert. Best Practices Leistungsbenchmark Serverlösungen Wie in Abbildung 1 zu sehen ist, erhöht sich die Leistung des Speicher-Subsystems nahezu linear von der langsamsten zur schnellste Konfiguration; d. h. von einem Single-ChannelSpeicher auf jedem Xeon Prozessor Memory-Controller, bestückt mit einem 8GB DDR3 1600 MHz Single-Speichermodul, zum schnellsten Speicher-Subsystem mit einem QuadChannel (auch als 1 DIMM je Kanal (DPC) bekannt), in dem jeder Speichersockel in der ersten verfügbaren Speicherbank jedes Prozessors mit vier 8GB 1600 MHz-Speichermodulen bestückt ist. Selbst bei der erhöhten elektrischen Last der Quad-Channel-Konfiguration (1 DPC), kann eine nahezu vierfache Steigerung der Speicherleistung im Subsystem auf ~70GB/s im Vergleich zu einer Single-Channel-Konfiguration beobachtet werden – eine Ideallösung für Anwendungen, die hohe Leistung für ressourcenintensive Anwendungen wie IMDB erfordern. Speicherfrequenz und Leistung Abb. 2. Leistung der Speicherfrequenz gemessen mit SiSoft Sandra 2012 Testkonfiguration beinhaltete SiSoftware Sandra 2012 Speicherbenchmark auf Intel Romley Plattform S2600GZ mit zwei Xeon E5-2665 2.40GHz Prozessoren und 192GB Speicher (2 x KVR16R11D4K4/32). CPU Hyperthreading und Energiesparen deaktiviert. In Abbildung 2 verwenden wir dieselben 8GB DDR3 Speichermodule, die mit vier unterschiedlichen Speichergeschwindigkeiten (MHz) symmetrisch über beide SpeicherSubsystemen der Intel Xeon E5-Familie laufen, um eine ausbalancierte Konfiguration zu Best Practices Leistungsbenchmark Serverlösungen erreichen und um die bestmögliche Leistung in allen Speichergeschwindigkeiten zu erzielen. Wenn die Speichermodule mit 800 MHz laufen, liegt die niedrigste Leistung bei ~40GB/s dauerhafter Übertragungsgeschwindigkeit, gemessen mit dem integrierten STREAMSpeicher-Benchmark SiSoft Sandra 2012. Während dem Höherskalieren der Frequenz können wir eine nahezu lineare Steigerung der Speicherleistung auf maximale ~70GB/s bei einer Geschwindigkeit von 1600 MHz erkennen. Ideal für Szenarios, bei denen in den Speicher geschriebene Ressourcen die höchstmögliche Leistung erfordern, um effizient zu bleiben. Speicherkapazitäten im Verhältnis zur Frequenzleistung Abb. 3. Speicherkapazitäten im Verhältnis zur Frequenzleistung gemessen mit SiSoft Sandra 2012 Testkonfiguration beinhaltete SiSoftware Sandra 2012 Speicherbenchmark auf Intel Romley Plattform S2600GZ mit zwei Xeon E52665 2.40GHz Prozessoren und 192GB Speicher (KVR16R11D4K4/32). CPU Hyperthreading und Energiesparen deaktiviert. Zum Abschluss unserer Untersuchungen von Speicherleistungen sehen wir uns in Abbildung 3 die Leistung eines Speicher-Subsystems an, einmal bei Bestückung mit einem 192GB und 1066 MHz Speicher und einmal bei Bestückung mit 128GB bzw. 64GB, mit jeweils 1600 MHz. Die erhöhten Speicherkapazitäten, die mit symmetrisch über beide Speicher-Subsysteme Best Practices Leistungsbenchmark Serverlösungen verteilten 128GB (16x 8GB) oder 64GB (8x 8GB) und mit jeweils 1600 MHz laufen, zeigen ungefähr dieselbe ~70GB/s Dauerleistung. Obgleich die höhere 192GB Speicherkapazität (24x 8GB) mit niedrigeren 1066 MHz läuft, zeigt sie als Ausgleich für die erhöhte Speicherkapazität einen geringfügigen Abfall von ~17GB/s in der Dauerleistung. Zusammenfassung Wenn wir die spezifischen Regeln für die Speicherkanalbestückung von Serverprozessor und Memory-Controller einhalten, können wir die richtige Balance in der Optimierung unseres Speichers mit einfachen Schritten erreichen, z.B. durch die Bestückung aller vier Speicherkanäle. Durch die bis zu vierfache Erhöhung der Speicherleistung können die Rentabilität und ROI erhöht und gleichzeitig die Gesamtbetriebskosten (TCO) während der Lebensdauer des Servers reduziert werden. Referenzen [1] Predicting User Preference for Movies using NetFlix database, Department of Electrical and Computer Engineering Carnegie Mellon University (Vorausberechnung von Benutzerpräferenzen für Filme unter Verwendung der NetFlix Datenbank, Department of Electrical and Computer Engineering Carnegie Mellon University) http://users.ece.cmu.edu/~dbatra/publications/assets/goel_batra_netflix.pdf [2] SiSoft Sandra Q & A - Memory Benchmark, SiSoftware http://www.sisoftware.co.uk/?d=qa&f=ben_mem&l=en&a= [3] Intel® Xeon® Prozessor E5-2600 Produktfamilie News Datenblatt, Intel® http://download.intel.com/newsroom/kits/xeon/e5/pdfs/Intel_Xeon_E5_Factsheet.pdf © 2013 Kingston Technology Europe Ltd und Kingston Digital Europe Ltd, Kingston Court, Brooklands Close, Sunbury-on-Thames, Middlesex, TW16 7EP, England. Tel: +44 (0) 1932 738888, Fax: +44 (0) 1932 785469. Alle Rechte vorbehalten. Alle Marken und eingetragenen Marken sind Eigentum ihrer jeweiligen Besitzer. MKF-549