COMPUTERWOCHE
  • Aktuelles
  • Innovation & Transformation
  • Moderne Arbeitswelten
  • IT Infrastruktur
  • Hybrid IT & Cloud
  • Suche
  • Datenschutz
  • Cookie Policy
  • Impressum
  • © IDG Tech Media GmbH
COMPUTERWOCHE COMPUTERWOCHE
In Kooperation mit Fujitsu Deutschland Fujitsu Deutschland
Computerwoche
  • Aktuelles
  • Innovation & Transformation
  • Moderne Arbeitswelten
  • IT Infrastruktur
  • Hybrid IT & Cloud
IT Infrastruktur

Wege durch den Datendschungel

Archivierung – Daten speichern für die Ewigkeit

05.02.2021
Artikel empfehlen

Bei der Archivierung wandern inaktive, aktuell nicht mehr benötigte Daten von den Produktionsservern in einen sekundären "Archivspeicher". Dort werden die Daten und Dokumente langfristig aufbewahrt - mehrere Jahre oder sogar Jahrzehnte. Diese Langfristspeicherung erfolgt vor allem aus rechtlichen Gründen, aber auch aus Kostengründen.

Rechtliche Aspekte bilden für viele Unternehmen die zentrale Motivation, warum sie ihre Daten archivieren. Bestimmte Dokumente wie Rechnungen, Geschäftsbriefe und Verträge sind nach geltendem Recht oft zehn Jahre und länger aufzubewahren. Die gesetzliche Grundlage für die langfristige Archivierung liefert das Handelsgesetzbuch, die Abgabenordnung (AO) und die Grundsätze zur ordnungsmäßigen Führung und Aufbewahrung von Büchern, Aufzeichnungen und Unterlagen in elektronischer Form sowie zum Datenzugriff (GoBD).

Neben den gesetzlichen Vorgaben hat jedes Unternehmen auch interne Compliance-Regeln und regulatorische Anforderungen zu beachten, die oft auch branchenspezifisch sind. In vielen Branchen gibt es beispielsweise spezielle Regelungen, die teilweise noch längere Aufbewahrungsfristen vorgeben. In der Medizin etwa müssen Patientendaten mehr als 30 Jahre lang aufbewahrt werden.

Das Archivieren von Geschäftsdaten über lange Zeiträume erfolgt aber nicht nur, weil es gesetzlich vorgeschrieben ist. Archivierungslösungen bieten auch eine effektive Möglichkeit, wichtige Unternehmensdaten für lange Zeit vorzuhalten. Zudem erlaubt die Langfrist-Speicherung eine effizientere Verwaltung wachsender Datenmengen.

Beispielsweise ist es teuer und Performance-mindernd, Daten, die aktuell nicht mehr benötigt werden, ständig auf Produktiv-Systemen vorzuhalten. In großen Mengen verringern Daten auf einem produktiven System dessen Leistung. Datenbankabfragen beispielsweise werden langsamer, wenn alte, aktuell nicht mehr relevante Daten ständig mitgezogen werden müssen. Zudem reduziert die Datenarchivierung auch den Aufwand für die Sicherung und Wiederherstellung. Ein Backup und Recovery des Produktionssystems ist mit weniger Daten viel schneller.

Drachenblutbaum - Symbol für Archivspeicher

Für die Reise durch den Storage-Dschungel hat Fujitsu ein einprägsames Bild konstruiert: Einen Fluss mit Bäumen am Ufer. Das bildliche Äquivalent zum Archivspeicher ist der Drachenblutbaum oder Dragon Blood Tree. Dieser in Marokko und auf den Kanaren heimische Baum erreicht eine Höhe von mehr als 30 Metern und überlebt unter härtesten Wetterbedingungen 600 und mehr Jahre. Die breite, kugelige und abgerundete Krone zusammen mit der weißlich-grauen Baumrinde, die blutrotes Harz absondert, verleiht ihm etwas Außergewöhnliches.

Der Dragon Blood Tree hat mit Archivspeicher-Lösungen vieles gemeinsam.
Der Dragon Blood Tree hat mit Archivspeicher-Lösungen vieles gemeinsam.
Der Dragon Blood Tree hat mit Archivspeicher-Lösungen vieles gemeinsam.
Foto: Fujitsu

Weil die Menschen früher glaubten, bei dem roten Harz handele es sich um das Blut von Drachen, erhielt der Baum seinen mystischen Namen. Tatsächlich wurde dem Harz eine magische Wirkung nachgesagt und von den alten Griechen, Römern und Arabern für die Wund- und Frakturheilung sehr geschätzt. Auch heute noch wird das Harz für medizinische Zwecke wie die Behandlung von Infektionen verwendet.

Drachenblutbäume und Archivspeicher haben viele gemeinsame Eigenschaften. "Genauso wie diese Bäume sehr lange überleben, können auch Archivdaten jahre- und jahrzehntelang auf den Archivspeichern überleben" sagt Roopa Vispi, Product Marketing Manager Storage bei Fujitsu. "Und so wie der Drachenblutbaum unter widrigsten klimatischen Bedingungen und Bedrohungen überlebt und wächst, können auch Archivdaten in geschützten Storage-Systemen unter externen Bedrohungen weiterexistieren und überdauern."

Auch der Ressourcenverbrauch ist bei beiden Systemen gering: Ähnlich wie der Drachenbaum wenig Boden und Wasser benötigt, sind auch Archivspeicher sehr genügsam und müssen lediglich sicher gelagert werden. Obwohl der Archivspeicher also wenig Kosten verursacht, entfaltet er einen enormen Business-Nutzen.

Auch der gesundheitliche Nutzen des Harzes hat seine Entsprechung. So wie das Harz mit seiner heilenden Wirkung ein verstecktes Juwel des Drachenblutbaums ist, sind in den Archivdaten viele Informationen versteckt, die zu Business-Benefits führen, wenn diese freigelegt werden. Dazu müssen die archivierten Daten allerdings für entsprechende Business-Tools wie Analytics- oder KI-Werkzeuge zugänglich sein.

Medien nach Bedarf: Tapes und Festplatten

Wenn Daten zehn Jahre oder länger aufbewahrt werden sollen, spielen die Speichermedien eine zentrale Rolle. Als Speicherträger werden vor allem Tapes genutzt. Sie haben bei der Datenarchivierung im Vergleich zu anderen Medien mehrere Vorteile. So sind Magnetbänder kostengünstig, haben hohe Kapazitäten, eine gute Durchsatzleistung sowie eine lange Haltbarkeit und Lebensdauer und lassen sich gut auslagern.

Wichtig ist vor allem: Im Gegensatz zu anderen Speicherformen, halten Bänder in der Regel viel länger und sind weniger anfällig für Risiken, die etwa moderne Platten-Laufwerke aufweisen. Magnetbänder lassen sich auch noch nach 20 Jahren sicher lesen, während die durchschnittliche Festplatte gerade einmal fünf Jahre hält. "Bänder und Tape-Librarys sind überdies hoch skalierbar und können jederzeit wachsen, wenn die Archivierungsdaten zunehmen", sagt Storage-Expertin Roopa Vispi.

Bänder bieten außerdem eine sehr gute "Offline-Fähigkeit" und die Möglichkeit des "Air Gap" - also die physische Trennung vom sichernden Netzwerk. Durch den "Air Gap" verhindert moderne Bandsicherungs-Technologie, dass Cyber-Attacken wie Ransomware-Angriffe auf die gesicherten Daten überspringen - denn eine Bandkassette, die aus dem System genommen wurde, ist elektronisch unzugänglich. Andere Laufwerke sind immer online und dadurch verwundbar.

Warum Archivierung? Eine zentrale Motivation ist es, nicht mehr benötigte, inaktive Daten von den produktiven Storage-Systemen wegzunehmen und auszulagern.
Warum Archivierung? Eine zentrale Motivation ist es, nicht mehr benötigte, inaktive Daten von den produktiven Storage-Systemen wegzunehmen und auszulagern.
Warum Archivierung? Eine zentrale Motivation ist es, nicht mehr benötigte, inaktive Daten von den produktiven Storage-Systemen wegzunehmen und auszulagern.
Foto: Fujitsu

In der Praxis werden heute in Archivlösungen verschiedene Medien gemischt. "Das Band ist zweifellos der wirtschaftlichste Speicher für Archivdaten", sagt Storage-Expertin Roopa Vispi. "Wir sehen aber auch viele Gründe, warum Archivdaten auf einer Disc verfügbar sein sollten - beispielsweise, um Zugriff auf die Daten oder Online-Zugriff zu haben. Deshalb gibt es die Möglichkeit, verschieden Technologien zu mischen."

Manchmal dürfen archivierte Daten nicht verändert werden - der Gesetzgeber fordert dies für bestimmte Daten. Man spricht dann von revisionssicherer Archivierung. Diese revisionssichere Archivierung geht also noch einen Schritt weiter als die normale Archivierung und stellt höhere Anforderungen.

Appliances ermöglichen vollautomatisierte Archivierung

Als konkrete Archivierungssysteme kommen verschiedene IT-Lösungen in Frage. Diese reichen von einfachen Software-Hardware-Lösungen, die den Archivierungsprozess lediglich verwalten bis hin zu intelligenten und hochautomatisierten Appliances.

Intelligente Software unterstützt umfangreich bei der Archivierung und dem Management der Daten. Beispielsweise automatisiert Software Archivierungsprozesse und legt sie auf frei wählbaren Speicherträgern ab. Besonders einfach gestaltet sich die Archvierung mit Appliances. Die Komplettsysteme aus Software und Hardware sind sofort einsatzfähig und können einfach in Betrieb genommen werden - das spart Zeit, interne Ressourcen und Nerven. Viele dieser Systeme ermöglichen eine vollautomatische Archivierung.

Bei Bedarf holt die Archivierungslösung die Daten auch wieder aus den Archivspeichern zurück. Insbesondere, wenn mit archivierten Daten wieder gearbeitet werden soll, ist es erforderlich, diese von Band wieder auf Disks, eventuell sogar auf die Produktivspeicher zurückzuholen. "Dies ist deshalb notwendig, weil Bandtechnologie auf sequenzielles Schreiben und Lesen ausgerichtet ist, und nicht um darauf Prozesse ablaufen zu lassen", erklärt Roopa Vispi. "Wenn Sie beispielsweise Analysen zu früheren Daten durchführen möchten oder eine Steuerprüfung ansteht, müssen Sie die Daten vom Band auf die Disc hochladen, damit sie sofort verfügbar sind. Mit der richtigen Appliance lassen sich alle diese Prozesse automatisieren.

Den Informationsschatz im Archiv nutzen

Der letzte Aspekt spricht eine wichtige neuere Entwicklung an: Die Fahrtrichtung der Daten in Richtung Archivspeicher ist heute keine Einbahnstraße mehr. Die Zeiten, in denen historische Daten dem Vergessen anheimfielen, sobald sie aus dem Produktionsspeicher entfernt wurden, sind vorbei. Historische Daten werden längst nicht mehr offline, außerhalb des Standorts, unzugänglich gespeichert. Durch die Bereitstellung der richtigen Infrastruktur, Software und Richtlinien lassen sich auch Archivdaten für Erkenntnisse nutzen, die dem gesamten Unternehmen einen Mehrwert bieten und helfen, Entscheidungen zu fällen und Prognosen für die Zukunft zu treffen.

Beispielsweise setzen Unternehmen auf Echtzeitanalysen, um Empfehlungen für E-Commerce-Kunden abzugeben, den Finanzhandel zu automatisieren oder um Kredit- oder Sicherheitsentscheidungen zeitnah zu treffen. Diese superschnelle Entscheidungsfindung erfordert häufig die Analyse historischer Daten - wofür auf die archivierten Daten schnell zugegriffen werden muss, um sie abzufragen.

Ebenso erfordern KI und maschinelles Lernen riesige Datenpools für Analysen und vor allem Trainings. Für das Training von Deep-Learning-Modellen sind beispielsweise möglichst große Datenmengen notwendig, deren Umfang oft nur erreicht wird, wenn auch archivierte Daten hinzugezogen werden. Diese bereits archivierten Daten müssen dann möglichst nah an die CPU herangeführt werden. Die Unternehmen, die auf diese riesigen Pools aus eigenen, historischen Daten problemlos zugreifen und diese durchsuchen können, sind am besten in der Lage, New-Age-Anwendungen wie Deep Learning zu verwenden.

Auch bei der Nutzung der archivierten Daten unterstützen moderne Archivierungslösungen. Viele der im Kontext KI und Analytics benötigten Funktionen werden dann von der Archivierungssoftware oder in einer Kombination aus Sicherungs- und Archivierungssoftware bereitgestellt.

Artikel empfehlen

Nächster Artikel: Mit Fugaku gegen Krebs und COVID-19

COMPUTERWOCHE
In Kooperation mitFujitsu Deutschland

Per E-Mail versenden

 

Artikel als PDF downloaden

 

Über den Autor

 
Schließen