ETL steht für Extract, Transform, Load, was einen Prozess in der Datenintegration beschreibt.
- Extract (Extrahieren): Hier werden Daten aus verschiedenen Quellen wie Datenbanken, Dateien oder APIs abgerufen.
- Transform (Transformieren): Die extrahierten Daten werden dann nach den Anforderungen des Zielsystems umgewandelt. Das kann Bereinigen, Aggregieren oder Formatieren beinhalten, um sicherzustellen, dass die Daten für die Analyse oder Speicherung geeignet sind.
- Load (Laden): Schließlich werden die transformierten Daten in die Zielumgebung geladen, sei es eine Datenbank, ein Data Warehouse oder ein anderes Speichersystem.

Für ELT (Extract, Load, Transform) lautet die Reihenfolge wie folgt
- Extract (Extrahieren): Daten werden aus verschiedenen Quellen extrahiert, wie Datenbanken, Dateien oder APIs. Diese Rohdaten werden unverändert in die Zielumgebung geladen.
- Load (Laden): Die extrahierten Rohdaten werden in die Zielumgebung geladen, typischerweise ein Data Warehouse oder eine andere Speicherplattform.
- Transform (Transformieren): Innerhalb der Zielumgebung erfolgt die Datenverarbeitung und -transformation. Die Daten werden nach den Anforderungen des Zielsystems formatiert, bereinigt und aggregiert, um für Analyse- und Reportingzwecke geeignet zu sein.

Der Unterschied zwischen ETL und ELT liegt in der Reihenfolge. Bei ELT werden die Daten zuerst in das Zielsystem geladen, und die Transformation erfolgt dann innerhalb dieses Systems. Dies passt gut zu modernen Data-Warehouse-Architekturen, in denen leistungsstarke Datenverarbeitungsfunktionen direkt in der Zielspeicherumgebung verfügbar sind. ETL und ELT sind beide entscheidende Schritte im Datenmanagement, und die Wahl zwischen ihnen hängt von den spezifischen Anforderungen und Architekturen eines Projekts ab.