Hasso-Plattner-InstitutSDG am HPI
Hasso-Plattner-InstitutDSG am HPI
Login
  • de
 

14.06.2012

Fotot: HPI/ K. Herschelmann

Sie sind zu langsam: Festplatten herkömmlicher Art gehören für SAP-Mitbegründer Prof. Hasso Plattner zum alten Eisen. In seiner Eröffnungsrede des „Future SOC“-Symposiums am Hasso-Plattner-Institut in Potsdam skizzierte er lieber die Zukunft, und die heißt In-Memory-Computing.

Rotierende Platten seien einfach zu langsam um heutige Datenmengen zu verarbeiten. „Wir haben uns lange mit Caches beholfen und mit Caches, die Caches cachen,“ beschrieb Plattner die Art, wie bisher versucht wurde, auch bei extrem großen Datenmengen noch in akzeptabler Zeit Ergebnisse bei der Berechnung zu erreichen. Caches sind Zwischenspeicher, in denen ein Computer Daten, die er zur Berechnung braucht, kurzzeitig ablegt. Doch mit dieser Technik stoßen Software-Ingenieure heute an die Grenzen des Machbaren und des zeitlich Akzeptablen.Was Plattner mit diesem Akzeptablen meint? Benötigte eine Fluggesellschaft mitunter Stunden, um neue Preise zu kalkulieren, konnte sie die Abfragezeit nach Umstellung des Systems auf die neue In-Memory-Techniken auf wenige Minuten verkürzen.

Dabei kommen herkömmlichen Festplatten nicht mehr zum Einsatz. Vielmehr liegen die Daten im Arbeitsspeicher. Da sie sich ständig verändern, ist die permanente Speicherung nur noch im Ausnahmefall und für Sicherungskopien notwendig. Die als Caches bezeichneten Pufferspeicher werden damit weitgehend überflüssig.

Während in einem Heimcomputer in der Regel zwischen einem und zwei Gigabyte Arbeitsspeicher zum Einsatz kommen, verwenden die Rechner in den modernen Software-Labors ein Vielfaches davon. Einer dieser Forschungsrechner am Hasso Plattner Institut in Potsdam zum Beispiel kann auf 2 Terabyte zugreifen und hat damit mehr als das Tausendfache, genug um gigantische Datenbanken in kürzester Zeit zu bearbeiten und auszuwerten.

Die Einsatzbereiche der neuen Technik reichen von Logistik bis hin zur Auswertung von Daten aus dem Internet. Wiederum am Beispiel einer Fluggesellschaft erklärte Plattner, wie Betriebsdaten der Flugzeuge erfasst werden. Die Jets speichern Informationen zu beinahe jedem Bauteil. Der Vergleich der gesammelten Daten - der sogenannten unstrukturierten Daten - mit den Soll-Daten - den strukturierten Daten - erfolgt dank hochperformanter Datenbank-Systeme im Hauptspeicher nahezu in Echtzeit. Gerade dieser dynamische Wandel von unstrukturierten in strukturierte Daten ist es, was in Zukunft zähle, so Hasso Plattner.

Diese neue Art der Datenverarbeitung ermöglicht aber auch im Bereich der Unternehmensprozesse ein Umdenken. Waren früher die Unternehmensleitung und die Strategieplanung diejenigen, die schnell auf jedwede Art Information zugreifen konnten, brauchen heute vor allem Support und Verkauf den schnellen Zugriff. Von der Unternehmensspitze bis zum Kundenkontakt müssten alle Prozesse auf schnelle Informationsweitergabe ausgerichtet sein, forderte Plattner. Denn kein Kunde wolle schließlich 20 Sekunden auf eine Antwort warten, wenn er den Kundenservice anruft, so Plattner. Der Bearbeiter müsse innerhalb von Sekunden auf die gewünschten Daten zugreifen können. Auch das sei nur mit In-Memory-Systemen möglich. Die sogenannte Datenbankzeit - die Zeit die von einer Datenbankanfrage bis zur Antwort vergeht - müsse gegen null Sekunden gehen.

Ein weiteres Puzzle-Stück hin zur schnelleren Datenverarbeitung liege in einer neuen Art der Datenbank-Architektur, erklärte Hasso Plattner in seinem Eröffnungsvortrag weiter. Er nennt es „Column Store Layout“. Dahinter verbirgt sich die Datenorganisation in Spalten. Ein Trick dabei bestehe darin, ähnliche Daten zu komprimieren. Damit erreiche man kompaktere Datenbanken, die blitzschnell zu verarbeiten seien. Zudem könne man nur jene Spalten durchsuchen, die gerade notwendig seien. Bisherige Techniken durchsuchten Zeilenweise ganze Datensätze nach den gewünschten Informationen.

Dank In-Memory-Technik und neuer Datenbank-Architektur lassen sich die Verarbeitungszeiten von einigen Minuten auf nur noch Bruchteile von Sekunden reduzieren. So lange dauerte es bisher, bis ein Datensatz auf einer herkömmlichen rotierenden Festplatte überhaupt gefunden war.

Weiterführende Informationen: