Festplattengeometrie du Low-Level Datenstrukturen
Transcription
Festplattengeometrie du Low-Level Datenstrukturen
Festplatten Referat vom 03.11.1999 Festplatten Referat vom 03.11.1999 Gehalten von: • Boris Urban • Stefan Hügele • Oliver Kauba • Roland Englmann Seite 1 von 27 Festplatten Referat vom 03.11.1999 INHALT 1 AUFBAU UND FUNKTIONSWEISE......................................................................................................... 4 1.1 MECHANISCHER AUFBAU ........................................................................................................................ 4 1.1.1 Speichermedien ............................................................................................................................... 4 1.1.2 Das Material ................................................................................................................................... 4 1.1.3 Magnetische Beschichtung .............................................................................................................. 4 1.2 LESE/SCHREIB KÖPFE .............................................................................................................................. 5 1.2.1 MR Magnetoresistive Heads ........................................................................................................... 5 1.2.2 Gleithöhe ......................................................................................................................................... 6 1.2.3 Head Crash und Vermeidung .......................................................................................................... 6 1.2.4 Kopflandezone (Head Parking and Lading Zone)........................................................................... 7 1.3 KOPFAUSRICHTUNG ................................................................................................................................. 8 1.3.1 Der Antriebsmotor .......................................................................................................................... 8 2 FESTPLATTENGEOMETRIE UND LOW-LEVEL DATENSTRUKTUREN ................................... 10 2.1 WAS IST FESTPLATTENGEOMETRIE? ...................................................................................................... 10 2.2 SPUREN (TRACKS) ZYLINDER (CYLINDERS), SEKTOREN (SECTORS) ..................................................... 10 2.2.1 Spuren und Sektoren...................................................................................................................... 10 2.2.2 Unterschied Spur - Zylinder .......................................................................................................... 10 2.2.3 Zoned Bit Recording (Multiple Zone Recording) .......................................................................... 11 2.2.4 Sektorversatz (Interleaving) .......................................................................................................... 12 2.2.5 Cylinder und Head Skew ............................................................................................................... 12 2.2.5.1 Cylinder Skew........................................................................................................................... 12 2.2.5.2 Head Skew ................................................................................................................................ 13 2.3 FORMATIERUNGEN ................................................................................................................................. 13 2.3.1 Unterschied: High-Level und Low-Level-Formatierung............................................................... 13 2.3.2 Low-Level-Formatierung .............................................................................................................. 13 2.4 FEHLERERKENNUNGS-/KORREKTURVERFAHREN .................................................................................... 13 2.4.1 Allgemeines ................................................................................................................................... 13 2.4.2 ECC (= Error Correcting Code)................................................................................................... 14 2.4.3 Defect Mapping............................................................................................................................. 14 2.4.4 Spare Sectoring ............................................................................................................................. 14 2.5 PHYSIKALISCHE UND LOGISCHE GEOMETRIE ......................................................................................... 15 2.5.1 Physikalische Geometrie ............................................................................................................... 15 2.5.2 Logische Geometrie....................................................................................................................... 15 3 SCHNITTSTELLEN .................................................................................................................................. 16 3.1 ANMERKUNG ......................................................................................................................................... 16 3.2 SCHNITTSTELLEN ................................................................................................................................... 16 3.2.1 IDE /EIDE/Ultra DMA.................................................................................................................. 16 3.2.2 SCSI............................................................................................................................................... 16 3.2.2.1 Synchrone Datenübertragung .................................................................................................... 17 3.2.2.2 Terminierung............................................................................................................................. 17 3.2.2.3 ID / LUN ................................................................................................................................... 18 3.2.2.4 Differential SCSI / LVD ........................................................................................................... 18 Seite 2 von 27 Festplatten 4 Referat vom 03.11.1999 DATEISYSTEME....................................................................................................................................... 20 4.1 BEGRIFFSERKLÄRUNGEN ....................................................................................................................... 20 4.2 ÜBERBLICK ÜBER DIE DATEISYSTEME ................................................................................................... 20 4.2.1 FAT 12 / FAT 16 ........................................................................................................................... 20 4.2.2 FAT 32........................................................................................................................................... 20 4.2.3 NT-Filesystem (NTFS)................................................................................................................... 21 4.3 PARTITIONEN ......................................................................................................................................... 21 4.3.1 Primäre Partitionen ...................................................................................................................... 22 4.3.2 Erweiterte Partitionen................................................................................................................... 22 4.4 DER MASTER BOOT RECORD ................................................................................................................. 22 4.5 DIE DATEIORGANISATION AUF DER PLATTE .......................................................................................... 22 4.5.1 Von „Pfaden“ und „Verzeichnis-Bäumen“ .................................................................................. 22 4.5.2 Cluster........................................................................................................................................... 23 4.5.3 „File chaining“ oder „Wie kommt die Datei von der Platte in den Hauptspeicher?“ ................. 23 4.5.4 Löschen und Wiederherstellen von Dateien .................................................................................. 23 4.5.5 Fragmentierung & Defragmentierung .......................................................................................... 24 4.5.6 Fehler in der FAT.......................................................................................................................... 25 4.6 PARTITIONEN EFFIZIENT NUTZEN ........................................................................................................... 25 5 QUELLEN ................................................................................................................................................... 27 Seite 3 von 27 Festplatten Referat vom 03.11.1999 1 AUFBAU UND FUNKTIONSWEISE 1.1 Mechanischer Aufbau 1.1.1 Speichermedien Auf ihnen werden die Daten gespeichert. In modernen High-End Platten sind zwischen 2-6 dieser Speichermedien untergebracht. Für jeder Platte zwei Köpfe unten und Oben. D.h. 4 Platten = 8 Köpfe. 1.1.2 Das Material Voraussetzungen für die Auswahl des Trägermaterial sind: • Verarbeitbarkeit • Stabilität • Gewicht • Preis • Verfügbarkeit Heutige Festplattenspeichermedien bestehen häufig aus einer Aluminiumlegierung, welche diese Vorraussetzungen erfüllt. Wegen der hohen Drehgeschwindigkeit 10.000 U/min der Platten (0,075m * 3,14 * 10.000 U/min * 60min = 141,4 Km/h) und der geringen Flughöhe der Lese/Schreibköpfe müssen höchste Anforderungen an das Trägermaterial gestellt werden. Das Material muß extrem plan sein. Da die Technologie immer weiter fortschreitet und die Kopfflughöhe immer weiter abnimmt müssen neue noch genauere Kriterien die Auswahl des Materials bestimmen. Bestimmte Magnesiumlegierungen und Glasträger sind im Augenblick in der Entwicklung die diese Kriterien erfüllen. 1.1.3 Magnetische Beschichtung Die magnetische Beschichtung auf dem Plattenmaterial ist nur wenige m dick. Diese magnetische Beschichtung ist aus speziellen Herstellerspeziefischen Legierungen . Die eine möglich dichte magnetische Datenpackung speichern kann. Das Auftragen der Magnetischen Beschichtung auf das Plattenmaterial kann auf 2 verschiedene Art und Weisen geschehen: • Galvanisieren (wie bei der Schmuckindustrie) • Plasmabeschichtung (extrem flach /extrem teuer) Es erfolgt nach dem Auftragen der Magnetischen Schicht noch eine zusätzliche Beschichtung mit einer speziellen Schutzschicht die im weiten Sinne mit einem Ölfilm aber hauchdünn auf 3-Atomarer Ebene existiert. Sie soll die magnetische Schicht vor Berührung mit dem Lese/Schreibkopf schützen. Seite 4 von 27 Festplatten Referat vom 03.11.1999 1.2 Lese/Schreib Köpfe Die Köpfe der Festplatte sind das Interface zwischen dem Magneteischen Datenspeicher und dem Rest der Festplatte. Lese/Schreibköpfe bestimmen zum Großen Teil die Leistung einer Festplatte. Sie erzeugen einen Magnetischen Impuls um Daten zu speichern und ebenso wird ein magnetischer Impuls auf dem Speichermedium wieder in Daten umgesetzt. Sie sind einer der teuersten Teile einer Festplatte sie bestimmen Lese/Schreibqualität und Geschwindigkeit. 1.2.1 MR Magnetoresistive Heads MR Technologie brachte einen großen Leistungsschub. MR Technologie beruht nicht mehr darauf, das beim Überfliegen eines Magnetfeldes (Bits) durch eine Spule ein Strom erzeugt wird, sondern das Bit , welches als Magnetfeld auf dem Datenspeicher vorliegt erzeugt im Lesekopf einen Widerstand der über einen Sensor aufgezeichnet wird. Die MR Technologie erlaubt nun eine enorm höhere Speicherdichte der einzelnen Bits auf dem Datenträgermaterial. Dadurch das der MR Kopf keine Spannungen mehr erzeugt. Ist dieser um ein vielfaches sensibler auf magnetische Feldveränderungen. Dies erlaubt nun das die Signale nicht mehr mit der alten Stärke abgespeichert werden müssen. Die Magnetfelder selber beeinflussen sich nicht mehr selbst gegenseitig und so können sie etwas näher aneinander gelegt werden. MR Technologie kann nur zum Lesen benutzt werden. Zum schreiben wird immer noch die alte Technologie benutzt. Das bedeutet es existieren nun in einem sozusagen 2 Köpfe. Ein Lese(MR) und ein Schreibkopf. Seite 5 von 27 Festplatten Referat vom 03.11.1999 Dies bringt folgende Vorteile gegenüber der alten Technologie: kombinierte Schreib und Leseköpfe waren immer durch das Lesen oder Schreiben geprägt. Zum Beispiel wenn man die Anzahl der Windungen reduziert erhöht man die Lesesensibilität, aber macht es sehr Schwierig bei hohen Geschwindigkeiten zu schreiben und genau anderes herum. Bei getrennten Köpfen wie bei den MR Köpfen kann nun beides optimiert werden ohne gegenseitige Beeinflussung. 1.2.2 Gleithöhe Das größte Merkmal das Festplatten zu Floppys, Videorecordern unterscheidet ist, das die Köpfe keinen Kontakt zum Datenträger haben. Sie gleiten über die Oberfläche der Disc. Die Höhe zwischen Datenträger und Kopf wird als „Head Gap“ oder „Floating Height“ bezeichnet. Die Köpfe besitzen eine gewisse Vorspannung, das bedeutet sie werden leicht an die Platte gedrückt wenn diese sich nicht dreht. Diese Vorspannung bewirkt, das der Kopf eine gewisse Stabilität beim Aktiven Zustand erhält. Durch den Kraftvektor, der in Richtung der Platte drückt, sind größere Querkräfte nötig um den Kopf eine stabile Gleitlage zu ermöglichen, ebenso wie eine exakte Gleithöhe. Wenn die Platte auf Arbeitsgeschwindigkeit anläuft, gelangt der hochschnelle Luftstrom unter die Köpfe und hebt diese an. Sie gleiten wie Luftkissenboote. Die Gleithöhe hängt von der Konstruktion der Platte ab und ist nie dieselbe. Für eine höhere Speicherdichte müssen die Magnetischen Feldstärken(Bits) heruntergesetzt werden. Dies zieht die Verringerung der Gleithöhe mit sich. Moderne Festplatten haben eine Gleithöhe von ca. 50 µm und diese Höhe wird jährlich verkleinert. Dies erfordert ein sehr hohen Anspruch an das Trägermaterial. Es darf kein Dreck oder Schmutz oder gar Fingerabdrücke auf dem Träger sein. Ein menschliches Haar hat einen Durchmesser von ca. 0,07 mm, ein Staubpartikel ca. 0,038mm [1 inch = 25,39mm]. Vibrationen und Stöße müssen bei solchen Höhen mit hohem technischen Aufwand vermieden bzw. kompensiert werden, da es sonst zu einem Head Crash käme. 1.2.3 Head Crash und Vermeidung Zwei der am wenigsten geliebtesten Wörter im IT Bereich dürften wohl HEAD CRASH sein. Eine Möglichkeit soviel wichtige Daten wie möglich innerhalb kürzester Zeit zu verlieren. Wenn keine Datensicherung betrieben wurde, war’s das. Seite 6 von 27 Festplatten Referat vom 03.11.1999 Sehr hohe Belastung auf die Festplatte treten bei der Montage oder bei Unfällen wie Umkippen oder Anstoßen auf. Bei der Montage wurden 100 bis sogar 1000 G Belastung festgestellt (ins Gehäuse gefallen). Die größte Gefahr besteht darin das diese Belastung im Aktiven Zustand geschieht. Hier befindet sich der Lesekopf direkt über den Daten, zwar auf einem Luftpolster, aber sollte sich eine Schockamplitude dem Kopf nähern, wird dieser angehoben und durch die Vorspannung unterstützt durch das Luftpolster hindurch auf den Datenträger geschleudert. 8). Es wurden von allen Herstellern Wege gesucht diesen doch sehr kritischen Punkt des Datenverlustes auszuschalten. Es wurde als erstes die innere Struktur so konstruiert, das der Arm nicht solch dramatische Schwingungen ausführt. Dies kann durch spezielle konstruktive Mittel bzw. Strukturen erreicht werden. • Verringerung des Kopfgewichtes • Verringerung des Armgewichtes • Versteifung der Armstruktur • Kugellagerung der Datenträger und des Motors Die Lagerung zwischen Motor und Datenträger ist mit den Größtmöglichen Lagerelementen (Kugeln) konstruiert. Sie haben die größte Fläche zur Aufnahme des Stoßes und bringen diese Kraft auf den (blau) Kugellauf, der aus shockabsorbierenden und abriebfesten Material besteht. Als zweites wurden Wege gesucht übrigbleibende Spitzenschwingungen so zu eliminieren, daß das Luftpolster ausreicht um die Wucht zu Dämpfen. Hier wurde zum Beispiel das grüne Material an die Armbefestigung hinzugefügt. Dieses Material besteht aus stark Shock-absorbierenden Kunststoff. Dieses Material ist in der Lage Spitzenspannungen zu absorbieren. 1.2.4 Kopflandezone (Head Parking and Lading Zone) Wenn sich die Datenträger nicht drehen liegt der Kopf auf der Oberfläche des Datenträgers. Beginnt er sich zu drehen schleift der Kopf solange auf der Oberfläche, bis der Luftstrom schnell genug ist um den Kopf abzuheben. Wenn der Strom abgeschaltet wird, wird ein Notmechanismus ausgelöst, der den Kopf wieder zu der Landezone „zieht“. Dort fällt er dann, sobald der Luftstrom abreist, auf die Landezone wo er bis zum kompletten Stop des Datenträgers auf ihm herumschleift. Diese Landezone ist von Harddisk zu Harddisk unterschiedlich. Sie ist meistens mit einer besonders abriebfesten Legierung überzogen, so das keinerlei Abrieb entstehen kann. Der eine Kollision mit dem Lesekopf verursachen könnte. Seite 7 von 27 Festplatten Referat vom 03.11.1999 1.3 Kopfausrichtung Früher wurden Schrittmotoren zur Steuerung des Kopfes benutzt, dies hatte aber schwere Nachteile sobald die Festplatte Betriebstemperatur oder sogar mehr erreichte. Die Materialausdehnung war zwar nur gering aber genug um die Datenpakete nicht mehr in die Datenspur zu schreiben, sondern außerhalb. Wenn jetzt die Platte sich abkühlt, zieht sich das Material wieder zusammen und schiebt den Kopf wieder an seine Anfangsposition. Nachdem eine Platte „älteren Kalibers“ in einem Server ca. 4 Wochen aktiv war und danach 1Tag stand, konnten die Daten vom Vortag nicht mehr direkt gelesen werden, die Platte mußt sozusagen erst wieder Betriebstemperatur erreichen. Funktionsweise des Actuators (Kopf-Antriebseinheit) Um die Probleme mit der Wärme, den vorgegebenen Schritten (Steps) eines Schrittmotors und der sich daraus resultierenden Datenpaketverschiebung in den Griff zu bekommen. Löste man sich ganz von Mechanischen Teilen und ging auf ein Spulenprinzip das sich die Elektromagnetische Anziehungs- und Abstoßungskräfte zunutze macht. Mit dem elektrischen Strömen wird das magn. Feld erzeugt mit dem sich Köpfe um ein vielfaches präziser bewegen lassen als mit einem Schrittmotor. Ein sogenanntes „Servo Controll System“ liest die „Servo Codes“ die auf dem Datenträger stehen und zur Orientierung des Kopfes dienen aus und korrigiert so ständig die Arm Position. Diese „Servo Codes“ sind auf Teilen des Datenträgers gespeichert auf die dieser keinen Einfluß hat (außer mit Low-Level-Format: richtet diese Codes neu aus). Es gibt zwei formen der Anordnung der Servo Codes: 1. Alle Codes auf einer Seite einer Platte (schneller) 2. Alle Codes über die gesamten Platten verteilt (mehr Speicher) So hat die elektromagnetische Form der Kopfausrichtung folgende Vorteile: • Keine störende Hitzeausdehnung • Schneller als ein Schrittmotor Genauer als ein Schrittmotor (Dichtere Datenpakte möglich) 1.3.1 Der Antriebsmotor Um Festplatten die groß sind auch schnell zu machen ist ein entscheidender Faktor die Umdrehungszahl der Datenträger. In älteren Varianten der Harddisk waren 3600 U/min gängig. Im laufe der Entwicklung mußten die Daten aber immer schneller von den Platten geladen werden. Der einzige Weg war die Erhöhung der Drehzahl. auf 5200 dann auf 5400 weiter auf 7200 und High End Platten besitzen eine Drehzahl von 10 000 U/min. Diese Motoren, die die Drehzahlen konstant halten erzeugen eine gewaltige Hitze. Diese High End Platten bedürfen einer separaten Kühlung. Seite 8 von 27 Festplatten Referat vom 03.11.1999 Laden von Powerpoint und 1 MB großen Datei 37 36 35 34 Sec. 33 32 31 30 29 333 MHz; 5400 U/min 400 MHz; 5400 U/min 333 MHz; 7200 U/min Einen gewaltigen Leitungszuwachs erhält ein System durch Festplatten mit Umdrehungszahlen jenseits der 5400 U/min. Wie die obere Grafik eindrucksvoll zeigt ist ein Leistungsschub ohne CPUTausch durchaus mit der Festplatte möglich. Durch den steigenden Speicherplatzbedarf der Betriebssysteme ist ein schnellerer Datendurchsatz schon beim Booten notwendig. Diese Bootsequenz z.B. Win98 um die Hälfte zu verringern kann schon ein Austausch der Festplatte Abhilfe schaffen. Seite 9 von 27 Festplatten Referat vom 03.11.1999 2 FESTPLATTENGEOMETRIE UND LOW-LEVEL DATENSTRUKTUREN 2.1 Was ist Festplattengeometrie? Die Festplattengeometrie beschreibt, wie die Festplatte die Daten strukturiert und verwaltet. Da moderne Festplatten immer mehr Daten speichern können, müssen gleichzeitig auch spezielle Methoden entwickelt werden, um die Festplatte bestmöglichst zu unterteilen und dadurch eine optimale Nutzung, d.h. höhere Kapazität und Leistung, zu ermöglichen. 2.2 Spuren (Tracks) Zylinder (Cylinders), Sektoren (Sectors) 2.2.1 Spuren und Sektoren Grundsätzlich ist eine Festplatte in sogenannte „Spuren“ (Tracks) und „Sektoren“ (Sectors) aufgeteilt. Spuren sind konzentrische Kreise auf der Datenträgeroberfläche Spur (ähnlich der „Jahresringe“ bei einem Baumstamm), in denen die Daten gespeichert werden. Die Scheiben moderner Festplatten Sektor sind mittlerweile in mehrere 1000 Spuren unterteilt, die von außen nach innen fortlaufend numeriert werden. Jede Spur wiederum ist in mehrere Sektoren aufgeteilt, die die kleinste Speichereinheit einer Festplatte darstellen (512 Byte). 2.2.2 Unterschied Spur - Zylinder Im Zusammenhang von Festplatten wird anstatt von Spuren häufig auch von sogenannten „Zylindern“ gesprochen. Doch was ist eigentlich der Unterschied zwischen einem Zylinder und einer Spur? Da sich alle Lese-/Schreibköpfe synchron bewegen, sind sie physikalisch immer über bzw. unter der gleichen Spurnummer angeordnet (es ist nicht möglich, daß ein Kopf bei Spur 0 und ein anderer bei Spur 1000 ist). Da mehrere gleichgroße, übereinander angeordnete Kreise wie ein Zylinder wirken, werden alle übereinanderliegenden Spuren auch als „Zylinder“ bezeichnet. Im Normalfall macht es aber keinen Unterschied, ob man von Spur oder Zylinder spricht. Zylinder 0 Zylinder 1 Das Ansprechen eines Sektors auf der Festplatte geschieht durch das CHSSystem (= cylinder - head - sector), d.h. durch das Beziehen auf eine Zylinder-, Kopf- und Sektornummer. Das funktioniert, da durch die Kombination von Zylinder- und Kopfnummer auch die entsprechende Platte und Spur eindeutig bestimmt sind. Seite 10 von 27 Festplatten Referat vom 03.11.1999 2.2.3 Zoned Bit Recording (Multiple Zone Recording) Zoned Bit Recording Zone 2 Zone 0 Früher hatte jede Spur die gleiche Zahl von Sektoren (17), was aber eigentlich eine Platzverschwendung bedeutete, da die äußeren (wesentlich größeren) Spuren ineffektiv genutzt wurden. Um dem entgegenzusteuern, wurde das sogenannte „Zoned Bit Recording“ entwickelt. Durch diese Methode können auf den äußeren Spuren mehr Sektoren untergebracht werden als auf den inneren. Um dies zu erreichen, gruppiert man eine bestimmte Zahl von Spuren zu einer „Zone“. Die Spuren einer Zone werden dann jeweils in die gleiche Anzahl von Sektoren unterteilt. Je weiter man also nach außen kommt, um so mehr Sektoren gibt es pro Spur bzw. Zone. Diese Vorgehensweise hat neben der effizienteren Nutzung der äußeren Spuren einen weiteren Vorteil: die Datenübertragungsrate auf den äußeren Spuren ist deutlich höher, da dort bei einer Umdrehung des Datenträgers mehr Sektoren (= mehr Daten) gelesen werden, was folgende Tabelle recht eindrucksvoll darstellt: Zone 1 225 90,4 454 225 89,.2 4 454 214 85,8 5 454 205 82,1 6 454 195 77,9 7 454 185 74,4 8 454 180 71,4 9 454 170 68,2 10 454 162 65,2 11 454 153 61,7 12 454 142 57,4 13 454 135 53,7 Mbit/s 454 3 Zone 14 2 100 90 80 70 60 50 40 30 20 10 0 Zone 12 91,7 Zone 10 229 Zone 8 232 454 Zone 6 454 1 Datenübertragungsrate in Abhängigkeit der Zonen Zone 4 0 Datenübertragungsrate (Mbits/s) 92,9 Zone 2 Spuren pro Sektoren Zone pro Spur Zone 0 Zone 14 454 122 49.5 (Quelle: Quantum Fireball TM Product Manual, © 1996 Quantum Corporation.) Da im BIOS aber keine Möglichkeit vorgesehen ist, um verschiedene Sektorzahlen einzustellen, muß dieses Problem anders umgangen werden. Mehr dazu aber im Kapitel „physikalische und logische Geometrie“. Seite 11 von 27 Festplatten Referat vom 03.11.1999 2.2.4 Sektorversatz (Interleaving) 0 1 0 16 2 15 3 13 12 6 7 10 4 7 5 15 6 12 5 Faktor 1 13 4 Faktor 2 12 5 3 14 6 11 10 8 9 0 1 16 14 11 9 8 1 2 16 7 11 10 13 4 2 15 8 9 3 14 Faktor 3 Im Idealfall sind alle logisch aufeinanderfolgenden Sektoren auch physikalisch (d.h. auf der Scheibe) direkt nebeneinander angeordnet. Da die Festplatte aber sehr schnell rotiert, kann es bei älteren Modellen passieren, daß der Inhalt von Sektor 1 noch nicht komplett verarbeitet wurde und der Lesekopf noch nicht wieder bereit ist, wenn Sektor 2 vorbeikommt. In diesem Fall müßte der Lesekopf eine ganze Umdrehung warten, bis Sektor 2 gelesen werden kann, was einen merklichen Zeitverlust bedeuten würde. Dieses Problem wird durch den sogenannten „Sektorversatz“ oder auch „Interleaving“ gelöst. Dies ist möglich, da logisch aufeinanderfolgende Sektoren nicht zwingend auch physikalisch nebeneinander liegen müssen. D.h. durch das „Einschieben“ von anderen Sektoren zwischen Sektor 1 und 2 wird erreicht, daß der Kopf wieder lesebereit ist, wenn Sektor 2 vorbeikommt. Die Entfernung zwischen zwei logisch aufeinanderfolgenden Sektoren nennt man „Interleave Faktor“. Durch den Sektorversatz erhält man eine deutlich höhere Leistung der Festplatte, da die „Leerlaufzeit“, d.h. die Zeit in der der Lesekopf darauf wartet, daß der passende Sektor vorbeikommt, drastisch verkürzt wird. Für moderne Festplatten ist dieses Verfahren aber nicht mehr relevant, da deren Controller schnell genug sind, um mit einem 1:1-Interleave zurechtzukommen. Wichtig ist Interleaving aber trotzdem, da es die Basis für neuere Techniken wie Head und Cylinder Skew bildet. 2.2.5 Cylinder und Head Skew 2.2.5.1 Cylinder Skew Im laufenden Betrieb einer Festplatte kommt es häufig vor, daß zwei aufeinanderfolgende Spuren komplett ausgelesen werden müssen. Das bedeutet, zuerst wird Spur 1 ausgelesen, dann wird auf den nächsten Zylinder gewechselt und der ausgelesen. 0 1 2 Das Problem, das dabei auftritt, ist, daß der Wechsel von einem Zylinder zum nächsten (d.h. die Bewegung der Köpfe) Zeit benötigt. In dieser Zeit ist aber der Startsektor von Spur 2 schon vorüber, so daß der Lesekopf 1 4 4 wieder eine Umdrehung lang warten muß um weiterlesen zu können. 3 2 Auf die Gesamtleistung hat dieses Problem aber nicht so große Auswirkung wie das beim Interleaving, da es nur beim Wechsel von Spuren in Erscheinung tritt (Interleave-Problem bei jedem neuen Sektor). 0 3 Deswegen wird der Start-Sektor des Folgesektors verschoben, d.h. der Start-Sektor von Spur 2 liegt z.B. auf gleicher Höhe wie Sektor 10 von Spur 1. Durch diese Verschiebung kann unmittelbar nach Seite 12 von 27 Festplatten Referat vom 03.11.1999 Neupositionierung der Köpfe weitergelesen werden, was eine geringere Wartezeit beim Wechsel von Spuren und damit eine höhere Geschwindigkeit bedeutet. 2.2.5.2 Head Skew Ein vergleichbares Problem wie beim Wechseln von Spuren (→ Cylinder Skew) tritt auch beim Umschalten zwischen Leseköpfen innerhalb eines Zylinders auf, d.h. beim Wechsel auf die gleiche Spur einer anderen Platte. Deshalb versetzt man die Start-Sektoren der Spuren innerhalb eines Zylinders, was den Zeitverlust erneut minimiert und somit in höherer Geschwindigkeit resultiert. Im Vergleich mit Cylinder Skew und besonders Interleaving ist die hierdurch erzielte Geschwindigkeitssteigerung jedoch relativ gering, da das Umschalten zwischen den Köpfen kürzer dauert als der Wechsel auf einen anderen Zylinder. Sowohl Cylinder als auch Head Skew sind von den spezifischen Festplattendaten abhängig, d.h. davon, wie lange die Köpfe zur Positionierung bzw. zur Umschaltung brauchen. 2.3 Formatierungen 2.3.1 Unterschied: High-Level und Low-Level-Formatierung Bei der Formatierung muß man zwischen zwei grundlegenden Methoden unterscheiden: der „Low-Level-Formatierung“ (der „eigentlichen“ Formatierung der Festplatte), und der „HighLevel-Formatierung“, die betriebssystemabhängig ist und die logische Struktur der Festplatte (z.B. MBR, Dateisystem) festlegt. 2.3.2 Low-Level-Formatierung Die Low-Level-Formatierung erstellt die physikalische Struktur der Festplatte, d.h. es wird die genaue Position und Zahl der Spuren und Sektoren festgelegt. Neue Festplatten haben (bedingt durch Techniken wie Zoned Bit Recording, Cylinder/Head Skew) sehr komplexe innere Strukturen und werden deshalb schon low-level-formatiert vom Hersteller ausgeliefert. Bei alten Modellen muß der Benutzer diesen Schritt selbst durchführen. Da eine Low-Level-Formatierung praktisch einem kompletten Neuanfang entspricht, ist hier bei eigenhändigem Formatieren besondere Vorsicht geboten, da es sonst zu groben Fehlern kommen kann. Besonders wichtig ist es, daß man nur die vom Hersteller vorgesehene Spezialsoftware zur LowLevel-Formatierung verwendet. 2.4 Fehlererkennungs-/korrekturverfahren 2.4.1 Allgemeines Obwohl der Anwender meist nichts davon merkt, ist es für eine Festplatte völlig normal, daß sie Lesefehler produziert. Dies ist eine unvermeidlich Tatsache, die das ständige Vergrößern der Kapazität und das Erhöhen der Geschwindigkeit mit sich bringen. Denn um dies zu erreichen, wurde der Abstand zwischen den Spuren und Sektoren immer mehr verringert, es werden schwächere Signale verwendet um Störungen zu verhindern und auch die Umdrehungszahlen steigen stets an. Da aber kein Anwender deswegen Lesefehler in Kauf nehmen würde, sind immer ausgeklügeltere Verfahren zur Fehlerkorrektur und -vermeidung nötig um die Zuverlässigkeit zu erhalten. Hierbei Seite 13 von 27 Festplatten Referat vom 03.11.1999 gehen die Hersteller einen Kompromiß zwischen Geschwindigkeit und Fehlerhäufigkeit ein. Dies kann man gut mit dem Maschinenschreiben vergleichen: man ist schneller, wenn man 100 Wörter pro Minute schreibt und dabei 2-3 Fehler korrigiert anstatt 75 Wörter fehlerfrei zu tippen. 2.4.2 ECC (= Error Correcting Code) Als Grundlage für die Fehlererkennung und -korrektur bei Festplatten dient der ECC (= „error correcting code“ bzw. „error correction code“ bzw. „error correcting circuits”), basierend auf der Reed-Solomon-Methode, wie er auch bei vielen anderen PC-Komponenten eingesetzt wird (z.B. CDRom, …). Dazu erhält jeder Sektor zusätzlich zu seinen Nutzdaten eine bestimmte reservierte Bit-Zahl an ECCInformationen. Diese ECC-Codes werden automatisch beim Schreiben eines Sektors mit erstellt. Wie viele Bits für die Fehlerkorrektur verwendet werden, ist wiederum ein Kompromiß zwischen Platzverbrauch und Sicherheit (mehr Bits = bessere Korrektur; benötigt aber auch mehr Platz, d.h. man kann weniger Sektoren pro Spur unterbringen). Moderne Festplatte benutzen inzwischen über 200 Bits ECC-Code pro Sektor. Beim späteren Auslesen der Daten kann dann anhand des ECC-Codes festgestellt werden, ob der Sektor richtig gelesen wurde. Sollte dies nicht der Fall sein, werden entsprechende Schritte eingeleitet: 1. ECC-Korrektur 2. erneute Leseversuche 3. erweiterte Fehlerkorrektur Sollte keiner dieser Schritte zum Erfolg führen, meldet die Festplatte einen Lesefehler, was in der Praxis aber eher unwahrscheinlich ist. 2.4.3 Defect Mapping Neben der Fehlerkorrektur durch ECC gibt es weitere Möglichkeiten, um Fehler vom Benutzer unbemerkt zu beheben. Ein Beispiel hierfür ist das „Defect Mapping“. Da es, wie vorher schon erwähnt, trotz aller Präzision unmöglich ist, eine absolut fehlerfreie Festplatte zu fertigen, werden sie während der Herstellung gründlich auf Fehler hin getestet. Dabei werden alle problematischen Sektoren intern markiert und in einer speziellen Tabelle festgehalten. Dadurch wird verhindert, daß während einer High-Level-Formatierung versucht wird, diese Teile der Festplatte zu benutzen. Diese markierten Bereiche werden dann bei einer Oberflächenanalyse als „Bad Sectors“ also defekte Sektoren - sichtbar. 2.4.4 Spare Sectoring Das „Spare Sectoring“ ist sozusagen die Fortführung des Defect Mapping. Diese Technik wird bei neuen Festplatten angewendet, da es viele Leute störte, wenn auf ihrer neuen Platte nach der Formatierung schon „defekte Sektoren“ waren. Um zu verhindern, daß die defekten Sektoren bei einer Oberflächenanalyse ans Licht kommen, reserviert man eine bestimmte Zahl von Sektoren (teilweise auch ganze Spuren) als Ersatz. Wird nun ein defekter Sektor entdeckt, markiert ihn der Controller und weicht automatisch auf einen der Ersatzsektoren aus, ohne daß der Benutzer etwas davon merkt. Dieses Verfahren hat im Prinzip aber nur den Vorteil, daß Programme wie Scandisk keine defekten Bereiche melden - in Wirklichkeit sind sie aber trotzdem vorhanden! D.h., daß die Festplattenhersteller eigentlich potentiellen Speicherplatz dafür opfern, daß die Festplatte nach außen hin fehlerfrei wirkt. Seite 14 von 27 Festplatten Referat vom 03.11.1999 2.5 Physikalische und logische Geometrie Ältere Festplatten waren recht einfach strukturiert: es gab eine bestimmte Anzahl von Köpfen, Spuren pro Datenträger und Sektoren pro Spur, die einfach im BIOS eingegeben wurden. Bei modernen, wesentlich komplexer aufgebauten Festplatten trifft dies aber nicht mehr zu. Zum Beispiel entstehen durch das Zoned Bit Recording Spuren mit einer unterschiedlichen Anzahl an Sektoren - im BIOS kann man aber nur einen Wert für Sektoren je Spur eingeben. Aber auch ohne derartige Techniken wären die BIOS-Einstellungen problematisch, da sie maximal 63 Sektoren pro Spur zulassen moderne Festplatten aber weit über 100 besitzen. Da die Einstellungsmöglichkeiten im BIOS also praktisch unverändert blieben, mußte man gewisse Tricks anwenden, um die Kompatibilität neuer Festplatten zu wahren. Hierbei ist es wichtig, zwischen „physikalischer“ und „logischer“ Geometrie zu unterscheiden. 2.5.1 Physikalische Geometrie Die physikalische Geometrie bezeichnet die tatsächliche Zahl der Köpfe, Zylinder und Sektoren der Festplatte. Die tatsächliche physikalische Geometrie einer Festplatte ist aber äußerst schwer herauszufinden, denn alle Angaben auf der Festplatte, im Handbuch oder auch das Ergebnis von „Autodetect“ im BIOS betreffen lediglich die logische Geometrie. Auch die Support-Hotlines der Hersteller können in den meisten Fällen nicht weiterhelfen. 2.5.2 Logische Geometrie Um das Problem mit den BIOS-Einstellungen zu umgehen, bedient man sich hypothetischer Parameter, der sogenannten „logischen Geometrie“, mit denen das BIOS umgehen kann und die den Zugriff auf die gesamte Festplatten ermöglichen. Das bedeutet, daß im BIOS eigentlich nur Scheinwerte stehen müssen, die (rechnerisch) die gleiche Zahl an Sektoren (und damit die gleiche Kapazität) ergeben wie sie tatsächlich vorhanden sind. Diese BIOS-Werte haben zwar mit der physikalischen Geometrie gar nichts zu tun - dies stört aber nicht weiter, da der Rest des Systems die „richtigen“ Werte gar nicht kennt. Die Umwandlung von der logischen in die tatsächliche (physikalische) Geometrie erfolgt nämlich ausschließlich durch den Controller. Ein Beispiel für die Unterschiede liefert folgende Tabelle. Entscheidend ist hierbei, daß die Gesamtzahl der Sektoren gleich ist (aus der Sektorzahl und -größe wird die Gesamtkapazität errechnet): Angabe Lese-/Schreibköpfe Physikalische Geometrie 6 Logische Geometrie 16 Zylinder (Spuren pro Scheibe) 6.810 7.480 Sektoren pro Spur 122 bis 232 63 Gesamtzahl der Sektoren 7.539.840 7.539.840 (Quelle: Quantum Fireball TM Product Manual, © 1996 Quantum Corporation.) Diese Festplatte hätte also eine Kapazität von 7.539.840 * 512 Byte = 3682 MB. Seite 15 von 27 Festplatten Referat vom 03.11.1999 3 SCHNITTSTELLEN 3.1 Anmerkung Bei der Ausarbeitung dieses Referats ergaben sich für mich einige Schwierigkeiten. Diese lagen hauptsächlich daran, dass ich als „Quereinsteiger“ in dieser Berufsausbildung mich mit der Thematik Computer vorher kaum beschäftigt hatte und mich demzufolge auch erst in das Fachgebiet einarbeiten musste und noch muss. 3.2 Schnittstellen Es gibt verschiedene Schnittstellentechnologien, die Sekundärspeicher der CPU zugänglich machen. Zum Beispiel die Geräteschnittstelle, wie SCSI oder EIDE/Ultra DMA. Die Geräteschnittstelle grenzt an den Systembus. Hier gibt es beispielsweise PCI oder ISA-Bus. Seit der Umstellung der Schnittstellenbausteine auf das PCI-Interface (bis 133 MB/s) als Datenweg zum Hauptspeicher ist in jüngster Vergangenheit nur noch die Geräteschnittstelle der limitierende Faktor bei der Datenübertragung. 3.2.1 IDE /EIDE/Ultra DMA IDE (Integrated Drive Electronics) / EIDE (Enhanced IDE) ist zur Zeit der typische Standard bei PCBussystemen. Der Controller befindet sich entweder direkt auf dem Motherboard oder auf einer separaten Steckkarte. Der Controller trägt seinen Namen zu unrecht. Er ist eigentlich nur ein einfacher Signalwandler und die eigentliche Steuer-Elektronik (Controller) befindet sich auf dem angeschlossenen gerät (Festplatte, CDROM, ...). Dies hat den Vorteil, dass diese Elektronik individuell auf das Gerät abgestimmt ist. Bei früheren Bus-Systemen (MFM, RLL) musste der Controller zu allen Festplatten kompatibel sein. Dadurch waren die Datenübertragungsraten wesentlich geringer als heute. Der IDE-Bus (auch AT-Bus) ist standardmäßig auf eine Kapazität von 528 MB pro Festplatte beschränkt. EIDE unterstützt Festplatten bis zu 127 GB. An einen IDE-Controller lassen sich zwei IDE-Geräte anschließen. Ein EIDE-Controller hat meistens zwei Kanäle und ermöglicht bis zu vier Geräten. Werden zwei Geräte an einem Kanal angeschlossen, so muss eine Reihenfolge festgelegt werden. Dies geschieht in den meisten Fällen mittels Jumper (Steckbrücken). Das erste Gerät wird als Master, das Zweite als Slave „gejumpert“. Ist ein Gerät alleine an einem Kanal angeschlossen, lautet die Einstellung Single. Bei einigen Geräten ist die Einstellung Master und Single identisch. Ultra DMA ist der Nachfolger von EIDE. Typ Übertragungsgeschwindigkeit Anzahl Geräte IDE 4,1 MB/s. 2 EIDE 16 MB/s 2 Ultra DMA 33 MB/s 2 Ultra DMA II 66 MB/s 2 3.2.2 SCSI SCSI (Small Computer System Interface) ist seit Mitte der 80´er Jahre ein Standard bei Bus-Systemen. SCSI ist in seiner ursprünglichen Form ein bidirektionaler 8-BIT-Bus, der nicht für ein bestimmtes Gerät entwickelt wurde; vielmehr wurde SCSI definiert um verschiedene Geräte, wie Scanner, Plotter, Drucker und externe Speichermedien (CD-ROM, MO-Laufwerke) miteinander zu verbinden. Seite 16 von 27 Festplatten Referat vom 03.11.1999 Da sich über die Jahre der SCSI-Bus weiterentwickelt hat, gibt es verschiedene SCSI Normen: Breite Übertragungsgeschwindigkeit Anzahl Geräte SCSI 1 8 Bit 5 MB/s 7 SCSI 2 8 Bit 5 MB/s 7 Wide SCSI 2 16 Bit 10 MB/s 15 Fast SCSI 2 8 Bit 10 MB/s 7 Fast Wide SCSI 2 16 Bit 20 MB/s 15 Ultra SCSI 8 Bit 20 MB/s 7 Ultra Wide SCSI 16 Bit 40 MB/s 15 Ultra 2 SCSI 16 Bit 80 MB/s 15 Ultra 160 / m SCSI 16 Bit 160 MB/s SCSI-Typ Alle Übertragungen laufen synchron. Ausnahmen: SCSI 1, SCSI 2, Wide SCSI 2. 3.2.2.1 Synchrone Datenübertragung Befinden sich Sender und Empfänger im Gleichtakt, so müssen nicht nach jeder Datenüber-tragung zusätzliche Synchronisationsinformationen übertragen werden. Daher ist die synchrone Datenübertragung am SCSI Bus schneller als die asynchrone und üblich. Bei asynchroner Datenübertragung wird zusätzlich eine Bestätigungsinformation vom Empfänger zum Sender zurückgesendet. Da bei SCSI viele Geräte extern angeschlossen werden (z.B. Band- , MO-Laufwerk, Scanner, CD-Wechsler, ...) ist die maximale Kabel- bzw. Bus-Länge und die richtige Terminierung sehr wichtig. SCSI Typ Maximale Bus-Länge SCSI 1 6 Meter SCSI 2 3 Meter Ultra SCSI 3 Meter, bis 3 Geräte; 1,5 Meter, mehr als 3 Geräte Ultra 2 SCSI 12 Meter* Ultra 160 / m SCSI 12 Meter* * durch LVD-Technik möglich. 3.2.2.2 Terminierung Der SCSI-Bus muss im Gegensatz zu IDE / EIDE / Ultra DMA an den physikalischen Enden terminiert sein. Wird keine korrekte Terminierung durchgeführt, kann es zu fehlerhaften Datenübertragungen bis hin zu Hardwaredefekten kommen. Gerade die relativ großen Kabellängen bei SCSI benötigen saubere Signale, die nicht durch Reflektionen gestört werden dürfen. Probleme bei der Terminierung treten meistens dann auf, wenn interne und externe Geräte an den SCSIController angeschlossen werden. Beispiel 1: Ein Rechner hat zwei Festplatten und ein CD-ROM intern. Das Kabel geht vom Controller zu Festplatte 1, zu Festplatte 2 und zum CD-ROM. Terminiert werden muss der Controller und das CD-ROM Laufwerk. Controller - Festplatte 1 - Festplatte 2 - CD-ROM Seite 17 von 27 Festplatten Referat vom 03.11.1999 Beispiel 2: Jetzt wird an den Rechner ein Bandlaufwerk extern angeschlossen. Das interne Kabel wird nicht verändert und extern verbindet ein zweites Kabel den Controller mit dem Bandlaufwerk. Terminiert muss jetzt das Bandlaufwerk und das CD-ROM, da sie die physikalischen Enden des SCSI Busses bilden. CD-ROM – Festplatte 2 – Festplatte 1 – Controller - Bandlaufwerk Neuere SCSI-Controller haben einen intelligenten Terminator, da sonst bei jedem An- und Abbau von externen Geräten der Rechner geöffnet und die Terminierung auf dem Controller gesetzt oder aufgehoben werden muss. Bei den meisten Geräten wird die Terminierung über Jumper oder DIP-Schalter aktiviert / deaktiviert. Vereinzelt werden aber auch noch Widerstandsarrays auf die Platinen gesteckt. Es gibt zwei Arten der Terminierung: 1. Passive Terminierung: • Sie wird hauptsächlich bei SCSI 1 und SCSI 2 eingesetzt. • Mit einem 220 Ohm Widerstandsnetzwerk (Array) werden die Signalleitungen gegen +5 V und mit einem 330 Ohm Array gegen Masse terminiert. 2. Aktive Terminierung: • Sie ist Pflicht bei Ultra SCSI. • Mit einer Spannungsregler-Schaltung wird der optimale Widerstandswert zur Terminierung gegen +2,85 V und gegen Masse erzeugt. Dadurch wird eine saubere Signalübertragung erreicht. Große Probleme bereitet die Terminierung bei einem gemischten Betrieb von 8 Bit (Narrow) und 16 Bit (Wide) Geräten. Hier werden spezielle Terminatoren benützt, die nur die oberen 8 Bit anschließen, während die unteren 8 Bit erst am Ende des letzten Narrow-Geräts Terminiert werden. Controller (16 Bit) – Festplatte (16 Bit) – CD-ROM (8 Bit) 3.2.2.3 ID / LUN Damit am SCSI-Bus ein Gerät erkannt wird, muß ihm eine ID-Nummer zugeordnet werden. Eine ID (IDentification number) darf pro SCSI-Bus nur einmal vergeben werden. Die Doppelbelegung ist neben der falschen Terminierung eine der häufigsten Fehlerquellen bei SCSI-Systemen. Bei Narrow- (8 Bit) SCSI ist die Nummerierung 0 bis 7, bei Wide- (16 Bit) SCSI 0 bis 15. Der Controller belegt selbst auch eine ID (meistens die höchste). Dies bedeutet, daß bei Narrow-SCSI 7 Geräte und bei Wide-SCSI 15 Geräte angeschlossen werden können. Bootplatten sollten die niedrigste ID haben, da das System beim Start den Controller von ID 0 aus nach oben auf Geräte prüft. LUNs (Logical Unit Number) kommen nur selten vor, da sie von kaum einem Gerät unterstützt werden. Einige CD-Wechsler arbeiten mit diesen Sub-IDs. Der Wechsler hat am SCSI-Bus eine ID und jede seiner CDs hat eine eigene LUN mit der sie direkt angesprochen werden kann. Bei SCSI sind bis zu 8 LUN pro ID erlaubt. 3.2.2.4 Differential SCSI / LVD Im Gegensatz zu den normalen (single ended) SCSI ist bei Differential SCSI jede Leitung doppelt vorhanden. Die Signale werden gleichzeitig durch beide Leitungen gesendet und am Controller bzw. am Gerät werden die Pegel der Signale miteinander verglichen. Die Information steckt hierbei in der Pegeldifferenz beider Signale. Sollte nun während der Übertragung eine Störung (Nahnebensprechen) auftreten, so wird das Signal gleichzeitig in beiden Leitungen beeinflußt. Am Ende kommt aber die gleiche Information raus, da die Differenz trotz Störung gleichbleibt. Mit dieser Technik ist es Möglich, sowohl Narrow- als auch Wide-SCSI-Buslängen von bis zu 25 Metern zu erreichen. Seite 18 von 27 Festplatten Referat vom 03.11.1999 Die LVD-Technik (Low Voltage Differential) wird ab Ultra 2 SCSI eingesetzt. Die Betriebsspannung des SCSI-Busses wird vermindert und auch damit das Auftreten von Reflexionen (Nahnebensprechen) . So ist es möglich die Kabellänge von 3 Meter auf 12 Meter zu erhöhen. Seite 19 von 27 Festplatten Referat vom 03.11.1999 4 DATEISYSTEME Meine Aufgabe in der Gruppe war es, die logischen Strukturen und Dateisysteme auf Festplatten darzustellen. Der folgende Beitrag dazu beschränkt sich dabei auf die wesentlichen Schwerpunkte. Im ersten Teil möchte ich kurz einen Abriss über die gängigen Dateisysteme geben. Der zweite Punkt beschreibt dann die Einteilung der Festplatte in Partitionen und deren Art. Im nächsten Block wird die Datenorganisation auf den Magnetplatten näher beschrieben. Den Abschluss bilden einige Information, wie man den Platz auf der Festplatte am besten ausnutzten kann. 4.1 Begriffserklärungen Bevor ich jetzt tiefer in die Materie einsteige, möchte ich vorab einige Begriffe erklären. File System/Dateisystem: Das Dateisystem stellt den Übergriff für alle logischen Strukturen und Softwareroutinen dar, die zum Plattenzugriff und zum Speichern auf die Platte notwendig sind. Sektor: Ein Sektor ist die kleinste Einheit auf der Festplatte. Seine Größe beträgt 512 Byte. Cluster/Allocation Unit: Mehrere Sektoren werden zu einem Cluster zusammengefasst. Dieser bildet die kleinste durch die FAT (siehe weiter unten) verwaltbare Einheit. File Allocation Table (FAT): Die FAT ist eine einfache Tabelle, die den Speicherort eines jeden Clusters verzeichnet. Zusätzlich werden hier auch die Clusterattribute vermerkt, wie z. B. ob der Cluster belegt ist oder zur Verfügung steht. Die FAT wird direkt neben dem Master Boot Record gespeichert. Es existieren immer zwei identische Kopien, die jedoch „in direkter Nachbarschaft“ gespeichert werden, sodass eine Beschädigung der Original – FAT oft auch die Kopie in Mitleidenschaft zieht. 4.2 Überblick über die Dateisysteme 4.2.1 FAT 12 / FAT 16 Diese Art der FAT ist die bis vor wenigen Jahren am häufigsten gebräuchliche. Unterstützt wird sie nach wie vor allen gängigen Betriebssystemen wie z. B. DOS, Win 3.x & 9x, Win NT, OS/2, Linux. FAT 12 & 16 adressiert die Cluster auf der Festplatte mit 12 bzw. 16 Bit Breite. So werden Partitionen bis zu 2 GB bei FAT 16 möglich. Nachteilig wirkt sich das heute bei der Formatierung sehr großer Platten aus, die dann in viele 2 GB Partitionen „zerstückelt“ werden. Die Einteilung in 32 KB Cluster führt außerdem zu relative großer Platzverschwendung. FAT 12 findet man heute z. B. noch auf Disketten, für ältere oder kleinere Harddisks genügt FAT 16 immer noch. 4.2.2 FAT 32 FAT 32 ist der Nachfolger von FAT 16 und die Reaktion auf die immer größer werdenden Festplattenkapazitäten. DOS 7.x, Win 9x und NT ab Version 5.0 können mit FAT 32 - -Partitionen Seite 20 von 27 Festplatten Referat vom 03.11.1999 umgehen. Die Adressierung findet allerdings nicht mit 32, sondern nur mit 28 Bit statt. So werden Partitionen bis zu 2 Terrabyte verwaltbar. Der Vorteil bei diesem System liegt hier klar bei der kleineren Clustergöße auch bei Partitionen größer als 2 GB. Auch wenn die FAT selbst dadurch größer wird, schwindet der Anteil des verschwendeten Platzes merklich. Hier möchte ich noch das von Microsoft verwendete „VFAT“ erwähnen. Das mit Windows 95 eingeführte „Virtual FAT“ brachte einige Neuerungen mit sich, die die Einschränkungen des auf der DOS – Umgebung aufsetzenden Windows – Oberfläche etwas mindern. Durch einen Trick wird mit VFAT die 8 + 3 – Konvention bei Dateinamen unter DOS bis 6.x umgangen. Dateien dürfen somit mit bis zu 255 Zeichen benannt werden. Dies stellt auch für den Benutzer die einzig relevante Neuerung dar, sodass ich auf die anderen hier nicht weiter eingehen möchte. Die nachfolgende Tabelle soll oben genannte Tatsachen noch einmal veranschaulichen. Attribute FAT12 Used For Floppies and small hard Small to large hard disk Medium to very large disk volumes volumes hard disk volumes FAT16 FAT32 Size of Each FAT Entry 12 bits 16 bits 28 bits Maximum Clusters 4,086 65,526 ~268,435,456 Cluster Size Used 0.5 KB to 4 KB 2 KB to 32 KB 4 KB to 32 KB Maximum Volume Size 16,736,256 2,147,123,200 about 2^41 Number of 4.2.3 NT-Filesystem (NTFS) Das Dateisystem von Windows NT dürfte zur Zeit eines der besten sein. Durch die 64 Bit breite Adressierung wären theoretisch 16 Exabyte große Partitionen möglich. In der Praxis beschränkt sich dieser Wert momentan aber auf 2 Terrabyte. Bei NTFS gibt es keine FAT in diesem Sinne. Da NT als ein absolut eigenständiges Betriebssystem konzipiert wurde, kommt es ohne die „DOS – Krücke“ aus. Daher besitzt NT auch eine eigene Dateiverwaltung, die als Master File Table (MFT)bezeichnet wird. Was macht NTFS so überlegen ? • Zum einen gibt es eine mehrfach gesicherte MFT. Eine beschädigte erste MFT kann somit fast immer wiederhergestellt werden. • In NTFS werden sämtliche Schreib- und Lesezugriffe protokolliert. So kann genau nachvollzogen werden, wer wann wie auf welche Dateien zugegriffen hat. • Darüber hinaus können an einzelne Dateien Zugriffsrechte vergeben werden. Ein notwendiges Feature für Netzwerkadministratoren. • Zusätzlich können Ordner und Dateien auf Systemebene verschlüsselt werden. • Als letzter wesentlicher Punkt kommt RAID – Fähigkeit hinzu. • Neben all diesen Vorteilen gibt es natürlich auch eine dunkle Seite der Medaille. So kann NTFS von anderen Betriebssystemen nicht verwendet werden und bietet eine verminderte Performance gegenüber FAT wegen der ausführlichen Protokollierungsmaßnahmen. 4.3 Partitionen Bei meinen Ausführungen hierzu möchte ich mich auf die gängigen Windows- und DOS-Versionen beschränken. Im Zusammenhang mit Festplatten fällt immer auch der Begriff Partitionen. Warum muss eine Festplatte überhaupt partitioniert werden? Seite 21 von 27 Festplatten Referat vom 03.11.1999 Die Antwort darauf ist eine einfach: durch die Partitionierung wird dieser Teil der Platte im Master Boot Record (MBR) als vorhanden und „bereit zum Dienst“ eingetragen. Beim anschließenden Formatieren wird dann das entsprechende Dateisystem erstellt. Dabei werden die Partitionen je nach Art in sogenannte „primäre“ und „erweiterte“ eingeteilt. 4.3.1 Primäre Partitionen Jede Festplatte kann nur maximal vier primäre Partitionen verwalten. Dies liegt in der Struktur des Master Boot Records (s. dazu weiter unten) begründet. Primäre Partitionen können allein den Status „aktiv“ annehmen und somit bootfähig werden. 4.3.2 Erweiterte Partitionen Möchte man nun mehr als vier anlegen, muss eine primäre in eine „erweiterte“ Partition umwandeln und von vorneherein als solche deklarieren. Im MBR werden dann max. drei primäre und eine erweiterte Partition verzeichnet. Innerhalb dieser erweiterten Partition kann man jetzt beinahe nach Lust und Laune mehrere sog. „logische“ Laufwerke definieren. Praktisch wird die Anzahl nur durch das Alphabet limitiert. Faktisch gibt es keinen Unterschied zwischen den Partitionsarten. Jedoch kann nur von aktiven primären Partitionen gebootet werden. 4.4 Der Master Boot Record Der MBR stellt den Ausgangspunkt eines jeden Bootvorgangs dar. Er wird im ersten Sektor auf der aktiven Partition gespeichert und bildet gleichzeitig den Anfang des Dateisystems. Im MBR sind zum einen die Master Partition Tabelle enthalten. In ihr werden sämtliche Informationen zu den auf der Platte vorhandenen Partitionen gespeichert. Zum anderen beherbergt der MBR den Master Boot Code. Dieses kleine Programm wird vom BIOS beim Rechnerstart geladen und macht nichts anderes, als dem installierten Betriebssystem die Kontrolle über den Bootvorgang zu übergeben. Der MBR ist wegen seiner Wichtigkeit für das System auch gerne Ziel von Virusprogrammierern. 4.5 Die Dateiorganisation auf der Platte 4.5.1 Von „Pfaden“ und „Verzeichnis-Bäumen“ Das einer Datei beschreibt die eigentliche Stärke eines Dateisystems. Eine Datei besteht im Grunde aus nichts anderem als ein „paar“ Bytes, die unter dem selben Namen abgespeichert wurden. durch die Art der Verwaltung derselben zeichnet sich ein Dateisystem aus. Dateien werden normalerweise nicht einfach auf der Festplatte abgespeichert. Um Ordnung zu halten, legt man sich „Ordner“ an. Die verzeichnislose Rohpartition stellt nach ihrer Formatierung das „root directory“ oder zu deutsch „Stammverzeichnis“ dar. Alle anderen Ordner werden danach hierarchisch unter diesem Stammverzeichnis angeordnet. Bei genügend großer und geordneter Struktur ergibt sich somit ein verzweigtes System aus Verzeichnissen und Unterverzeichnissen, das in seinem Aufbau an einen umgedrehten Baum erinnert. Man spricht von einem „Verzeichnisbaum“. Seite 22 von 27 Festplatten Referat vom 03.11.1999 Um nun eine Datei in diesem Gewirr zu finden, muss die jeweilige Anwendung ein sog. „Pfad“ „beschreiten“. Mit „Pfad“ meint man die Kombination aus Laufwerksbuchstabe, Verzeichnis, evtl. Unterverzeichnis und Dateinamen. Auf diese Art und Weise lässt sich jede Datei eindeutig wiederfinden. Außerdem verfügt der Ordner über eine Tabelle, die die Startcluster jeder Datei in diesem Verzeichnis enthält. 4.5.2 Cluster Wie schon oben erwähnt, besteht ein Cluster aus mehreren Sektoren. Ihre Anzahl kann zwischen 4 und 64 variieren, je nach FAT. Die Aggregation geschieht ganz einfach aus Gründen der Performance. Ansonsten hätte eine 2 GB – Partition über 4 Millionen einzelne Sektoren zu kontrollieren. Sämtlich Sektoren eines Clusters stehen plastisch gesehen „hintereinander“ auf der Platte und bilden einen „Block“. Eine Ausnahme bilden hier die Floppy – Drives, die teilweise auch nur einen Sektor pro Cluster verwalten. Die richtige Zusammenfassung von Sektoren in Zusammenhang mit der Partitionsgröße spielt eine große Rolle in Bezug auf die Ausnutzung der Plattenkapazität. Bei zu wenig durchdachter Einteilung kann bis zu 40 % des gesamten vorhandenen Speicherplatzes einfach „verloren“ gehen. Darauf werde ich aber im Kapitel „Partitionen effizient nutzen“ noch genauer eingehen. 4.5.3 „File chaining“ oder „Wie kommt die Datei von der Platte in den Hauptspeicher?“ Gehen wir davon aus, eine Anwendung benötigt zum Weiterarbeiten eine bestimmte Datei. Was wird geschehen.? Nun, zunächst wird die Anwendung sich aus dem Ordner, in dem sich die gewünschte Datei befindet, die Adresse des Startclusters holen. Danach überprüft das Programm den Eintrag für den Startcluster in der FAT. Dort steht der Speicherort des Folgeclusters beschrieben. So wiederholt sich der Vorgang, bis der Eintrag in der FAT die höchste mögliche Zahl des jeweiligen FAT – Systems enthält. Diese wird als Indikator für das Dateiende benutzt. Der Lesevorgang ist somit beendet. Beim Schreiben auf die Platte fordert das jeweilige Programm zunächst die gewünschte Anzahl freier Cluster von der FAT an. Diese übergibt dann die Adressen und markiert die Blöcke entsprechend. Grundsätzlich besitzt jeder Cluster einen Vermerk über seinen Status. Freie Blöcke werden in der Regel mit einer binären „0“ versehen. Des weiteren gibt es Codes für beschädigte und belegte Cluster auf der Festplatte. 4.5.4 Löschen und Wiederherstellen von Dateien Werden Dateien von der Harddisk gelöscht, sind sie nicht unbedingt verloren. In Wahrheit setzt das Betriebssystem nur an die erste Stelle des Dateinamens den Hex – Code „E5h“. Für das System bedeutet dies, dass alle zugehörigen Cluster wieder freigegeben sind. Der Speicherplatz wird nur wieder zur Verfügung gestellt. Seite 23 von 27 Festplatten Referat vom 03.11.1999 Wenn man nun aber keine großartigen Schreibaktionen auf die Platte durchführt, können die „gelöschten“ Dateien im Idealfall wieder komplett hergestellt werden. Das Betriebssystem „merkt“ sich die kürzlich gelöschten Dateien und kann diese auf Wunsch versuchen zu rekonstruieren. Bei einer Defragmentierung allerdings gehen diese Daten endgültig verloren. 4.5.5 Fragmentierung & Defragmentierung Eine Datei belegt eine bestimmte Anzahl Cluster auf der Platte. Wird sie gelöscht, werden diese Blöcke wieder zur Verfügung gestellt. Speichert man nun Dateien zu Anfangs „in Reihe“ auf der Festplatte, entstehen keine Lücken dazwischen und die Daten können am Stück gelesen werden. Löscht man jetzt aber Dateien und fügt wieder neue hinzu, werden die neuen auch in die einzelnen freien Blöcke zwischen den anderen Daten abgelegt. Dadurch werden diese neuen Dateien räumlich „zerstückelt“. Diesen Vorgang nennt man Fragmentierung. Natürlich schlägt sich der Lesevorgang einer über die Platte „verteilten“ Datei negativ auf die Leistung nieder. Der Lesekopf springt dauernd zwischen den verschiedene Positionen hin und her, es kommt kein hundertprozentig konstanter Datenstrom zu Stande. Um den Idealzustand wiederherzustellen, muss man die Festplatte defragmentieren. Dabei werden alle zusammengehörigen Cluster einer Datei wieder nacheinander auf der Harddisk angeordnet. Heute besitzen alle gängigen Betriebssysteme Tools, um diese Prozedur durchzuführen. Um den ganzen Vorgang etwas zu veranschaulichen, möchte ich ihn noch einmal anhand der folgenden Tabellen beschreiben. Diese Tabelle beschreibt den Rohzustand auf der Platte. Kein Cluster wird durch Daten belegt. (cluster 1) (cluster 2) (cluster 3) (cluster 4) (cluster 5) (cluster 6) (cluster 7) (cluster 8) (cluster 9) (cluster 10) (cluster 11) (cluster 12) Nehmen wir jetzt an, es werden Dateien gespeichert, die die unten beschriebene Menge an Cluster benötigen. A braucht einen, B vier, C zwei und D drei. A B B B C D D D B C Jetzt löschen wir Datei C. Es werden zwei Cluster frei. A B B B D D D B Schreiben wir danach eine Datei E auf die Platte, die drei Cluster benötigt. Zwei frei Blöcke werden wieder verwendet, der dritte hinten angehängt. A B B B B E D D D E E Löschen wir nun A und E. Die Datei F mit fünf Clustern wird zurückgeschireben. Wie man bereits jetzt schon erkennen kann, verstreuen sich die einzelnen Dateien mehr und mehr auf der Festplatte. F B B B B F F D D D F F Seite 24 von 27 Festplatten Referat vom 03.11.1999 Die Performance leidet merklich, der User entschließt sich, die Platte zu defragmentieren. Das Ergebnis sieht wie folgt aus. Alle Dateien stehen wie „am Schnürchen“ aufegreiht auf der Harddisk. B B B B F F F F F D D D 4.5.6 Fehler in der FAT Natürlich kann es auch vorkommen, dass Fehler in der FAT auftauchen. Diese können durch Systemabstürze und andere Unterbrechungen von Dateiaktionen entstehen wie z. B. einem Stromausfall. Im folgenden möchte ich nur kurz die möglichen Fehler umreißen. Verlorene Cluster: Diese Cluster werden in der FAT als belegt geführt, sind in Wirklichkeit aber keiner Datei zugeordnet. Querverbundene Dateien: Cluster in Dateien können in der FAT fälschlicherweise auf denselben Folgecluster verweisen. Ungültiger FAT-Eintrag: In diesem Fall wurde der Eintrag in der FAT selbst beschädigt. 4.6 Partitionen effizient nutzen Wie im vorhergehenden Text bereits erwähnt, können Festplatten auf unterschiedliche Weise organisiert sein. FAT 16 und 32 KB-Cluster oder FAT 32 mit 8 KB-Cluster, sämtliche Kombinationen sind möglich. Machen aber auch alle Varianten wirklich Sinn? Die Tatsache, dass auch ein Byte große Dateien immer einen ganzen Cluster belegen, führt dazu, dass im schlimmsten Fall sehr viel Platz einfach verschwendet wird. Auch wenn Cluster nur mit einem Byte besetzt sind, gelten sie in der FAT als komplett belegt. Den überschüssigen Speicherpaltz bezeichnet man auch als „Slack“, was ins Deutsche übersetzt soviel wie „Rest“ bedeutet. Nur wenn die gleiche Datei vergrößert wird, schriebt die Platte sie in den gleichen Block ,bis dieser an sein Maximum stößt. Folgende Tabelle zeigt den Verlust bei vielen kleinen Dateien auf der Platte. Size of Each Partition Number of Partitions Typical Total Slack (All Partitions) 2 KB 128 MB 16 28 MB 4 KB 256 MB 8 56 MB 8 KB 512 MB 4 112 MB 16 KB 1 GB 2 225 MB 32 KB 2 GB 1 450 MB Cluster Size Kann in diesem Fall also eine größere FAT Abhilfe schaffen? Seite 25 von 27 Festplatten Referat vom 03.11.1999 Dazu möchte ich zunächst die untere Tabelle betrachten. FAT Type FAT16 FAT32 Cluster Size 32 KB 4 KB Number of FAT Entries 65,526 524,208 ~ 128 KB ~ 2 MB Size of FAT Oben genannte Werte gehen dabei von einer 2 GB Partition aus. es wird auf den ersten Blick ersichtlich, dass die FAT 32-Version keinen großen Sinn macht, da die FAT mit 2 MB relativ zur Festplattengröße riesig gerät. Das System kann mit einer derartigen FAT schlecht umgehen. DA auf diese während des Normbetriebes sehr häufig zugegriffen wird, hält sie die Harddisk im eigenen Cache vorrätig. Dies bringt einiges an Performance. Erreicht die FAT-Größe allerdings solche Dimensionen, bleiben dem System nur zwei Möglichkeiten. Entweder wird die FAT in den Hauptspeicher verschoben oder nur unzureichend im Plattencache versucht zu halten. Erstere Lösung vermindert unnötig den Arbeitsspeicher des Gesamtsystems und letztere bremst die Schreib – Lesezugriffe enorm aus. Es besteht also ein Zusammenhang zwischen Partitionsgröße und Clustergröße in Bezug auf die Performance. Abschließend bleibt zu sagen, dass in Endeffekt nur ein sinnvolle Balance zwischen Cluster- und Partitionsgröße den „Slack“ auf ein erträgliches Maß reduziert. Moderne Partitionierungstools wie z. B. der Partition Magic von Power Quest finde allerdings „von ganz alleine“ die ideale Mischung. Seite 26 von 27 Festplatten Referat vom 03.11.1999 5 QUELLEN • • • • • • • IBM (http://www.ibm.com) Maxtor (http://www.maxtor.com) Quantum (http://www.quantum.com) Seagate (http://www.seagate.com) Fujistu (http://www.fujitsu.co.jp) PC-Guide (http://www.pc-guide.com) Webopedia (http://www.webopedia.com) Seite 27 von 27