Textversion
Info Angebote Rechtliches Kontakt/Impressum Links Shop Sitemap
Startseite Info Festplatten RAID-Systeme

Info


Datenverlust Datensicherung Welches Medium? Bandlaufwerke Festplatten

RAID-Systeme Direct Attached Storage Network Attached Storage Storage Area Network Schnittstellen



RAID-Systeme


Ein RAID-System (ursprünglich redundant array of inexpensive disks, heute redundant array of independent disks) dient zur Organisation mehrerer physischer Festplatten eines Computers zu einem logischen Laufwerk, das eine höhere Datensicherheit bei Ausfall einzelner Festplatten und/oder einen größeren Datendurchsatz erlaubt als eine physische Festplatte.

Während die meisten in Computern verwendeten Techniken und Anwendungen darauf abzielen, Redundanzen (das Vorkommen doppelter Daten) zu vermeiden, werden bei RAID-Systemen redundante Informationen gezielt erzeugt, damit beim Ausfall einzelner Komponenten das RAID als Ganzes seine Funktionalität behält.


Der Begriff wurde von Patterson, Gibson und Katz an der University of California, Berkeley in ihrer Arbeit „A Case for Redundant Array of Inexpensive Disks (RAID)“ zum ersten Mal verwendet (frei übersetzt: Redundanter Verbund kostengünstiger Festplatten).

Darin wurde die Möglichkeit untersucht, kostengünstige Festplatten im Verbund als logisches Laufwerk zu betreiben, um die Kosten für eine große (zum damaligen Zeitpunkt teure) Festplatte einzusparen.

Dem gestiegenen Ausfallrisiko im Verbund sollte durch die Speicherung redundanter Daten begegnet werden, die einzelnen Anordnungen wurden als RAID-Level diskutiert.


Die weitere Entwicklung des RAID-Konzepts führte zunehmend zum Einsatz in Serveranwendungen, die den erhöhten Datendurchsatz und die Ausfallsicherheit nutzen, der Aspekt der Kostenersparnis wurde dabei aufgegeben. Die Möglichkeit, in einem solchen System einzelne Festplatten im laufenden Betrieb zu wechseln, entspricht der heute gebräuchlichen Übersetzung: Redundant Array of Independent Disks (Redundante Anordnung unabhängiger Festplatten).


Der Betrieb eines RAID-Systems setzt mindestens zwei Festplatten voraus. Die Festplatten werden gemeinsam betrieben und bilden einen Verbund, der unter mindestens einem Aspekt betrachtet leistungsfähiger ist als die einzelnen Festplatten. Mit RAID-Systemen kann man folgende Vorteile erreichen:


Die genaue Art des Zusammenwirkens der Festplatten wird durch den RAID-Level spezifiziert. Die gebräuchlichsten RAID-Level sind RAID 0, RAID 1 und RAID 5.

Aus Sicht des Benutzers oder eines Anwendungsprogramms unterscheidet sich ein logisches RAID-Laufwerk nicht von einer einzelnen Festplatte.

PC-basierende Disk Arrays

Diese Betriebssystemabhängigen RAID-Systeme benötigen einen externen RAID-Controller, der in den vorhandenen Server installiert wird. Die Leistungsfähigkeit des Arrays wird ausschließlich von dem eingesetzten RAID-Controller und den ausgewählten Festplatten bestimmt.

Hochwertige RAID-Conroller haben einen namhaften Prozessor mit mindestens 8 MB Cache on Board, sind mit Echtzeit I/O-Analyse mit einstellbaren Cache-Parameter und Flash-ROM für einfache Firmware-Upgrades ausgestattet.

Schaltkreise auf dem Board überwachen die Temperatur und spannung im RAID-Gehäuse, das mittels Softwarelösungen dem System-Operator angezeigt wird.


Plattformunabhängige Disk Arrays

RAID-Systeme mit SCSI zu SCSI sind professionelle Lösungen für mittelgroße Netzwerkumgebungen. Das Array wird an den schon installierten SCSI-Host-Adapter des Servers angeschlossen. Der im Array befindliche SCSI-RAID-Controller übernimmt die kompletten RAID-Funktionen.

Je nach Hersteller und Modell variieren die Einsatzmöglichkeiten und Leistungsmerkmale des RAID-Systems.

Leistungsfähige SCSI zu SCSI Disk Arrays erreichen Datentransferraten von 20 MB/Sek. pro Kanal. Die auf dem Controller integrierten Schaltkreise überwachen und melden Temperatur-Schwankungen und den ausfall von Festplatten. Diese daten werden optisch dem System Operator gemeldet.


Obwohl RAID Ihnen erhöhte Sicherheit bietet, bedeutet das nicht...

... dass Sie auf eine Sicherung auf Tapes verzichten sollten!
... dass Bandlaufwerke oder Librarys überflüssig werden!

Lesen Sie hierzu mehr unter "Backup-to-Disk-to-Tape".


RAID 0: Striping – Beschleunigung ohne Redundanz

Streng genommen handelt es sich bei RAID 0 nicht um ein wirkliches RAID, da es keine Redundanz gibt.

RAID 0 bietet gesteigerte Transferraten, indem die beteiligten Festplatten in zusammenhängende Blöcke gleicher Größe aufgeteilt werden, wobei quasi im Reißverschlussverfahren diese Blöcke zu einer großen Festplatte angeordnet werden, so dass somit Zugriffe auf allen parallel durchgeführt werden können (engl. striping, was „in Streifen zerlegen“ bedeutet, abgeleitet von stripe, der „Streifen“).

Die Datendurchsatz-Steigerung (bei sequentiellen Zugriffen, aber besonders auch bei hinreichend hoher Nebenläufigkeit) beruht darauf, dass die notwendigen Festplatten-Zugriffe in höherem Maße parallel abgewickelt werden können. Die Größe der Datenblöcke wird als Striping-Granularität (auch „chunk size“ oder „interlace size“) bezeichnet. Meistens wird bei Raid 0 eine chunk size von 128 kb gewählt.

Fällt jedoch eine der Festplatten durch einen Defekt (vollständig) aus, kann der RAID-Controller ohne deren Teildaten die Nutzdaten nicht mehr vollständig rekonstruieren. Eine teilweise Restauration ist unter Umständen jedoch möglich, nämlich genau für die Dateien, die nur auf den verbliebenen Festplatten gespeichert sind, was typischerweise nur bei kleinen Dateien und eher bei großer Striping-Granularität der Fall sein wird.

RAID 1: Mirroring – Spiegelung

Ein RAID-1 muss aus mindestens zwei Festplatten bestehen, die exakt die gleichen Daten enthalten (engl. mirroring oder duplexing, s. u.). RAID 1 bietet die volle Redundanz der gespeicherten Daten, während die Kapazität des Arrays höchstens so groß ist wie die kleinste beteiligte Festplatte.

Fällt eine der gespiegelten Platten aus, kann jede andere weiterhin alle Daten liefern. Besonders für sicherheitskritische Echtzeitanwendungen ist das unverzichtbar. RAID 1 bietet eine hohe Ausfallsicherheit: zum Totalverlust der Daten führt erst der Ausfall aller Platten.

RAID 3: Striping mit Paritätsinformationen auf separater Festplatte

RAID 3 ist der Vorläufer von RAID 5. Im RAID 3 wird die Redundanz auf einer zusätzlichen Festplatte gespeichert. Als Redundanz bezeichnet man hier die bitweise Addition der einzelnen Bits der anderen Festplatten. Die bitweise Addition berechnet Summen von Einzelbits, die den Wert 0 und 1 enthalten können, und befolgt die Rechenregeln des mathematischen Zahlkörpers (GF(2)=Z/2Z), welcher nur die Elemente 0 und 1 enthält und bei dem die folgenden Rechenregeln gelten: 1+1=0, 0+1=1, 1+0=1, 0+0=0. Aus 1+1=0 folgt 1=-1.

Der Gewinn durch ein RAID 3 ist folgender: Angenommen, der RAID-3-Verbund besteht aus n datentragenden Festplatten und einer dedizierten Paritätsplatte mit Nummer n+1. Bei einem Ausfall einer der ersten n Festplatten (mit der Nummer i) werden, nach Austausch dieser Festplatte alle Daten auf die neue (i-te) Festplatte zurück synchronisiert, ausgehend von den Paritätsinformationen der n+1-ten Festplatte und den übrigen, unversehrten n-1 Daten-Festplatten. Der Ausfall der Paritätsplatte selbst wird, nach Ersetzen der Festplatte durch einfache Neuberechnung der Paritätsbits repariert.

RAID 3 ist inzwischen vom Markt verschwunden und wurde weitgehend durch RAID 5 ersetzt, bei dem die Parität gleichmäßig über alle Platten verteilt wird. Die dedizierte Paritätenfestplatte stellte einen Flaschenhals dar. Vor dem Übergang zu RAID 5 wurde RAID 3 zudem partiell durch RAID 4 verbessert, bei dem Ein-/Ausgabe-Operationen mit größeren Blockgrößen aus Geschwindigkeitsgründen standardisiert wurden.
Zusätzlich sei hier bemerkt, dass ein RAID-3-Verbund aus lediglich zwei Festplatten per Definition identisch ist mit einem RAID 1 aus zwei Festplatten.

RAID 5: Leistung + Parität

RAID 5 bietet sowohl gesteigerten Datendurchsatz beim Lesen von Daten als auch Redundanz bei relativ geringen Kosten und ist dadurch die beliebteste RAID-Variante. In schreibintensiven Umgebungen mit kleinen, nicht zusammenhängenden Änderungen ist RAID 5 nicht zu empfehlen, da bei zufälligen Schreibzugriffen der Durchsatz aufgrund des zweiphasigen Schreibverfahrens deutlich abnimmt (an dieser Stelle wäre eine RAID 0+1-Konfiguration vorzuziehen).

RAID 5 ist eine der kostengünstigsten Möglichkeiten, Daten auf mehreren Festplatten redundant zu speichern und dabei das Speichervolumen effizient zu nutzen. Dieser Vorteil kommt allerdings aufgrund hoher Controlleranforderungen und -preise oft erst bei mehr als vier Platten zum Tragen.

Die Nutzdaten werden wie bei RAID 0 auf alle Festplatten verteilt. Die "Paritätsinformationen" werden jedoch nicht wie bei RAID 4 auf einer Platte konzentriert, sondern ebenfalls verteilt.

RAID 6: Redundanz über zwei zusätzliche Festplatten

RAID 6 (Advanced Data Guarding) funktioniert ähnlich wie RAID 5, verkraftet aber den Ausfall von bis zu zwei Festplatten. Hier werden nicht ein, sondern zwei Fehlerkorrekturwerte berechnet und so über die Platten verteilt, dass Daten und Paritäten blockweise auf unterschiedlichen Platten liegen. Das bedeutet eine Anzahl von n+2 Festplatten brutto für einen Dateninhalt von n Festplatten netto, was allerdings schon bei wenigen Netto-Festplatten eine Kosten-Ersparnis gegenüber einfacher Spiegelung (RAID 1) darstellt.

Jedoch ist der Rechenaufwand bei den zugrundeliegenden XOR-Prozessen erheblich höher als bei RAID 5. Bei RAID 5 werden für ein Paritätsbit die Daten aus einer Daten-Zeile addiert (und bei erforderlicher Resynchronisation die Daten aus einer Daten-Zeile per Addition zurück resynchronisiert). Dagegen muss bei RAID 6 das Paritätsbit über mehrere Daten-Zeilen berechnet werden – die Resynchronisation, insbesondere bei zwei ausgefallenen Festplatten, erfordert einen Kalkül über Matrizen und Umkehrmatrizen aus der linearen Algebra (Codierungstheorie).

Ein RAID-6-Verbund benötigt mindestens vier Festplatten!

RAID 10: Mirror Striping Array

Dieser RAID-Level ist eine Kombination von RAID 1 (Mirroring) und RAID 0 (Striping) und hat Eigenschaften von Arrays - sicherheit und sequenzielle Performance. Manchmal wird dieser RAID-Level auch RAID 0 + 1 benannt.

Üblicherweise werden 4 Festplatten verwendet, da RAID 10 aus zwei Paaren gespiegelter Arrays besteht, die dann zu einem RAID 0 Array zusammengefasst werden. RAID 10 ist besonders geeignet, wenn große Dateien redundant gespeichert werden sollen; da keine Parity berechnet werden muss, sind Schreibzugriffe sehr schnell.

RAID Triple Parity

RAID TP ist ein proprietäres RAID mit dreifacher Parität vom Hersteller easyRAID. Laut Herstellerangaben können bei RAID TP bis zu drei Festplatten ausfallen.

Die Datenblöcke und die Paritäten werden parallel jeweils auf die einzelnen physischen Festplatten geschrieben. Die drei Paritäten werden auf verschiedene Stripes auf unterschiedlichen Platten abgelegt. Der RAID-Triple-Parity-Algorithmus benutzt einen speziellen Code mit einem Hamming-Abstand von mindestens 4.

Hierzu benötigt man mindestens vier Festplatten. Die Kapazität errechnet sich aus Festplattenanzahl minus drei.

JBOD

"JBOD" steht für Just a Bunch Of Disks, also "Nur ein Haufen Platten".
Der Begriff wird verwendet in Abgrenzung zu RAID-Systemen, um anzugeben, wenn Festplatten nicht im Verbund, sondern einzeln betrieben werden. Viele Hardware-RAID-Controller sind in der Lage, die angeschlossenen Festplatten dem Betriebssystem einzeln zur Verfügung zu stellen; die RAID-Funktionen des Controllers werden dabei abgeschaltet, und er arbeitet als einfacher Festplatten-Controller.

Ein JBOD kann auch, unabhängig vom Controller, eine auf beliebige Arten an den Computer angeschlossene Anzahl von Festplatten bezeichnen. Mithilfe einer Volume Management Software kann ein solches JBOD zu einem Software-RAID zusammengeschaltet werden.
Bei bestimmten RAID-Tools, wie z. B. dem VIA RAID-TOOL, wird der Begriff JBOD fälschlicherweise auch gleichbedeutend mit NRAID verwendet.

Druckbare Version