Surrogat-Technik

Transbase® Hypercube verwendet eigene numerische Codierungen, sogenannte Surrogate. Im Prinzip ähnelt dies der Vergabe von Postleitzahlen, die die Hierarchie abbilden. Diese Codierung wird dann für die geclusterte Speicherung der Daten im Hypercube-Index verwendet, der dabei die Surrogate der einzelnen Dimensionen für die multidimensionale Indexierung verschränkt.

Die Vergabe und ggf. Aktualisierung dieser Surrogate wird dabei automatisch von Transbase® Hypercube vorgenommen. Vom Entwickler werden lediglich die Hierarchieebenen für die Dimensionen und die entsprechenden Fremdschlüsselbeziehungen definiert.

Durch die hierarchische Codierung mittels der Surrogat-Technik ergeben die Einschränkungen auf Hierarchieelemente jeweils zusammenhängende Intervalle im Surrogatbereich.

 

Datenhaltung

Durch die automatische Pflege der Hierarchieinformation (Surrogate) in den Datenbeständen entfällt die Notwendigkeit einer speziellen Aufbereitung der Daten bei der Übernahme, was den ganzen Prozess erheblich erleichtert.
Außerdem tragen folgende Features dazu bei, dass die Datenübernahme und Auswertung in einfacher und effizienter Weise erfolgen kann.

  • Stored-Procedures und User-Defined-Functions ermöglichen komplexe Transformationen und Auswertungen während des ETL-Prozesses.
  • Der Transbase® OCI-Reader und der Transbase® JDBC-Reader ermöglichen den direkten Zugriff auf Oracle- bzw.  JDBC-fähige Datenbanken und machen so den Umweg über Export und Import überflüssig.
  • Verbreitete ETL-Tools können über Standard-Schnittstellen wie ODBC, OLEDB, ADO.NET und JDBC angeschlossen werden.
  • Spezielle Algorithmen beschleunigen das Einfügen großer Datenmengen in Transbase® Hypercube.
  • Mittels analytischer Funktionen können komplexe Auswertungen direkt in SQL formuliert werden (z.B. RANK, PARTITION OVER). Dadurch werden Reporting-Applikationen entlastet, während das Datenbanksystem seine Optimierungsmöglichkeiten voll ausschöpfen kann.

Datenauswertung

Ein spezieller Algorithmus sorgt für die optimale Ausnutzung der in den Surrogaten enthaltenen Hierarchieinformation:

  • Zunächst werden die Restriktionen der Dimensionen ausgewertet. Dadurch entstehen Intervalle auf den Dimensionscodierungen, die auf der Faktentabelle über den Hypercube-Index besonders performant evaluiert werden.
  • Durch die Hierarchie-Kodierungen in der Faktentabelle kann bereits eine Gruppierung und Zusammenfassung (z.B. Summierung) von Daten vorgenommen werden, ohne dass dazu die einzelnen Datensätze mit den Dimensionen kombiniert werden müssen.
  • Der Aufwand für die Kombination der wenigen verbleibenden Gruppen mit den Dimensionen (der sog. „Rückjoin“) ist daher nahezu zu vernachlässigen.

Durch diese Query-Abarbeitung beschleunigt sich die Ausführung solcher Anfragen um Größenordnungen im Vergleich zu herkömmlichen Datenbanksystemen.