Beschreibung
Die Speicherung riesiger Datenmengen ist eine besondere Herausforderung für skalierbare Internetanwendungen und Services. Partitionierung und Replikation von Daten sind dabei wohlbekannte Skalierungstechniken. Die Verteilung der Datenspeicher-Infrastrukturen bedingt dabei jedoch ein Abweichen von klassischen ACID-Datenmanagementprinzipien gemäß dem CAP (Consistency, Availability, Partition Tolerance) Theorem, welches aussagt, dass nur zwei dieser drei Eigenschaften in Verteilten Anwendungen gleichzeitig garantiert werden können. Für skalierbare Internetanwendungen mit großen Datenbeständen werden daher in der Regel die Anforderungen an die Datenkonsistenz zu Gunsten einer höheren Verfügbarkeit und Partitionierbarkeit aufgeweicht.
Key-Value-Datenbanken, die nach diesem Konzept arbeiten, bieten hochverfügbare und skalierbare Speichermöglichkeiten für eine ganze Reihe von Internetapplikationen und Diensten, angefangen bei Amazons Online-Kaufhaus bis hin zu Zyngas sozialer Online-Spielewelt. Im Rahmen des Vortrags werden solche Datenspeicherlösungen vorgestellt, wobei ein Fokus auf der NoSQL-Datenbank "Apache Cassandra" liegt - eine skalierbare Key-Value-Datenbank, die auch von Facebook verwendet wird.
Referent*innen
Markus Klems
Markus Klems hat am Karlsruher Institut für Technologie (KIT) Wirtschaftsingenieurwesen studiert und sein Studium mit einem Diplom abgeschlossen. Seitdem arbeitet er als Doktorand in der Gruppe von Professor Tai im Bereich Cloud Computing und ist seit 2007 ein aktiver Blogger der Cloud Computing Community. Seine Interessen sind Skalierbarkeit und Fehlertoleranz von Verteilten Softwaresystemen.