Guide zum eigenen E-Commerce Data Warehouse

Was bringt mir ein eigenes E-Commerce Data Warehouse
Inhaltsverzeichnis

In der heutigen Zeit, in der Onlineshops ständig mit neuen Herausforderungen konfrontiert werden, ist die Analyse von Umsätzen und Werbekosten essenziell, um unnötige Kostentreiber zu identifizieren und Umsatzpotentiale zu heben. Jedoch herrscht große Unsicherheit. Jede Werbeplattform hat sein eigenes Conversion-Tracking und Attributionsmodell. Je nach eingestelltem Attributionszeitraum werden unterschiedliche Umsätze bzw. ROAS-Ergebnisse ersichtlich. Onlineshop-Betreiber quält daher die Frage, welche Werbekanäle und Produkte wirklich profitabel sind und welche de facto keinen großen Ergebnisbeitrag bringen.

Hinzu kommen Fragen bspw. nach den Kosten für die Akquise eines Neukunden oder der Wiederkaufsrate von Kunden oder welche Artikel typische Cross-Sell-Produkte sind. Typische weitere Fragen sind diese nach unterschiedlichen Stornoquoten je nach Werbekanal oder die Berücksichtigung von unterschiedlich erzielbaren Deckungsbeiträgen je Sortimentsbereich.

Ein Data Warehouse kann hierbei enorm hilfreich sein, um sich eine Übersicht über die Daten zu verschaffen und diese effektiv auszuwerten. Ein eigenes E-Commerce Datawarehouse bildet dabei einen Single Point of Truth und bildet 100% der Umsätze ab, die in der Webanalyse oder in Übersichten von Google Ads oder Meta Ads nie vollständig sein können. In diesem Blogbeitrag erklären wir, warum die Einführung eines Data Warehouse zur Datenverwaltung in deinem Unternehmen eine lohnende Investition sein kann und worauf dabei zu achten ist.

Grundlagen: Data Warehouse

Was ist ein Data Warehouse?

Ein Data Warehouse (DWH) ist ein Speicherort für die Datenverwaltung, das Daten aus verschiedenen Datenquellen sammelt, transformiert und zur Analyse und Berichterstattung speichert. Das DTW ist speziell für Abfragen und Analysen optimiert und soll bei der Beantwortung von geschäftsrelevanten Fragen unterstützen.

Die Komplexität eines Data Warehouses

Obwohl nicht jedes E-Commerce-Unternehmen ein Data Warehouse benötigt, überwiegen die Vorteile deutlich. Die Nutzung von verschiedenen Werbesystemen wie Google Ads, Facebook Ads, Pinterest Ads, Microsoft Ads  und Shopsystemen kann [MW|R1] zu abweichenden Interpretationen aufgrund unterschiedlicher Quellen führen. Deshalb erfordert die Zusammenführung der Daten in Datenbank-Systemen eine smarte Kombination und richtige Interpretation, was nicht auf die leichte Schulter genommen werden sollte. Außerdem lässt sich bspw. mit Google Analytics ein Data Warehouse nicht ersetzen. Zwar wird es oft in ähnlichen Kontexten herangezogen, aber es ist z. B. wegen der Abhängigkeit von der Consent-Rate oder des Fehlens aller Marketing-Daten ungeeignet.

Hindernisse beim Data Warehousing

Gründe für Schwierigkeiten beim Vereinen der Daten

  • Isolierte Datensilos

Diese können ein Hindernis bei der Erstellung eines eigenen E-Commerce Data Warehouses sein, weil Daten in verschiedenen Systemen getrennt voneinander gespeichert werden. Wenn Google Ads, Meta Ads und z. B. Affiliate Netzwerke unterschiedliche Datenstrukturen und Perspektiven aufweisen und zusätzlich eigene Datenbanken mit Umsätzen oder Kosten dazukommen, kann das zu Komplikationen führen. Denn die Daten müssen erst aus diesen Silos extrahiert, transformiert und geladen werden, bevor das Data Warehouse sie verarbeitet. Dies kann zeitaufwendig sowie fehleranfällig sein.

  • Unterschiedliche Zählweisen 

Das bedeutet, dass unterschiedliche Anwendungen verschiedene Definitionen für dieselben Metriken oder Kennzahlen bei den Datenbeständen haben. Ein Beispiel wäre, dass in einem System eine Bestellung als „abgeschlossen“ gezählt wird, sobald der Kunde auf „Kaufen“ klickt, während in einem anderen System die Bestellung erst als abgeschlossen gilt, sobald der Kunde das Produkt tatsächlich erhält.

  • Schwindende Transparenz 

Das heißt, dass bestimmte Datenquellen weniger verlässlich oder nicht mehr verfügbar sind, was zu einer verringerten Qualität der Daten führt. Datenlücken durch eingeschränktes Tracking können sich bspw. negativ auf eine Google Performance-Max-Kampagne auswirken, da die Kampagne darauf ausgelegt ist, auf Basis von Daten Conversions zu maximieren. Z. B. können Datenlücken dazu führen, dass die Zielgruppenauswahl oder die Anzeigenauslieferung nicht optimal ist oder dass ineffektive Kampagnenelemente nicht identifiziert und in der Folge nicht verbessert werden können. In der Praxis kann es bei einer idealtypischen Customer Journey folgendermaßen aussehen:

Der Kunde sucht zunächst über Google und erhält dort das erste Mal Kontakt zur Marke, kauft aber noch nichts. Auf Facebook erkennt der Kunde dann die Marke in einer Anzeige wieder, klickt und landet auf der Website. Jedoch bleibt der Kauf noch aus. Erst nach einem Preisvergleich auf Idealo entscheidet der Kunde sich dazu, das Produkt zu kaufen. Innerhalb des Bestellprozesses sucht er jedoch noch schnell nach einem Gutschein und wird auf einer Affiliate-Seite fündig, bevor er letztlich den Kauf tätigt. Welchem Kanal wird nun welcher Wert der Conversion attribuiert?

Es ist nicht ausgeschlossen, dass der Conversion-Wert sowohl in Google Ads mit einem Wert von 250€ auftaucht, als auch bei Meta mit ebenfalls 250€. In Google Analytics wird dem Kanal Affiliate 250€ gutgeschrieben.

Dieses Attributionsproblem macht es komplizierter, den Einfluss auf den Kaufentscheidungsprozess eines Kunden zu bewerten. Je länger die Customer Journeys, desto größer wird diese Problematik, da es schwieriger wird, genau zu bestimmen, welcher Kanal am meisten zur Kaufentscheidung beigetragen hat.

Attribution: Welche Prozesse & Punkte solltest du im Blick behalten?

  • Multi-Device-Journeys

Man spricht von einer Multi-Device-Journey, wenn Kunden mehrere Geräte verwenden, z. B. Handy, Computer und Tablet. Hierdurch wird es schwieriger, die Interaktionen der Kunden über alle Geräte hinweg zu erfassen, um ein umfassendes Bild vom Nutzerverhalten zu erhalten.

  • Retouren

Sobald ein Kunde einen Artikel zurücksendet, muss das Data Warehouse diese Information verarbeiten und die Bestellhistorie aktualisieren, um die Retoure zu vermerken. Dabei können Retouren auch Auswirkungen auf andere Datenbereiche haben, darunter Umsatz, Lagerbestand sowie Kundenbindung. Werden Retouren nicht richtig berücksichtigt, macht es die Schlussfolgerungen aus den Daten fehleranfälliger.

  • Einheitliche Zeiträume

Einheitliche Zeiträume bedeuten, dass alle Daten im Warehouse auf eine einheitliche Zeitbasis bzw. Skala zurückgeführt werden. Das ermöglicht konsistente Vergleiche, was besonders bei Analysen zu saisonalen Geschäften und Trends vom Vorteil ist.

  • Perspektivenwechsel

Das Ziel eines Perspektivenwechsels ist es, die Betrachtung vom Werbekanal beispielsweise zum Produkt, Hersteller oder zur Warenkategorie zu ändern. Dadurch werden separate Reports erstellt, die individuelle Aspekte beleuchten und jeweils neue Einsichten aus den Datenbeständen liefern.

Die 3 größten Hindernisse in der Data-Collection

  1. DSGVO & ePrivacy 

DSGVO steht für die Datenschutzgrundverordnung der EU zum Schutz personenbezogener Daten. Der Knackpunkt ist hier, dass Daten nicht ohne explizite Zustimmung der Nutzer erhoben werden dürfen. Jeder kennt die Consent-Banner auf den Webseiten. Bei Ablehnung des Cookie-Consents dürfen keine Marketing- und Analysedaten erhoben werden und stehen somit auch nicht in Google Analytics oder Google Ads bereit, obwohl der Kunde möglicherweise einen Kauf tätigt. Je nach Höhe der sogenannten Opt-in Rate gibt es größere oder kleinere Daten-Diskrepanzen.

  • iOS & Tracking Blocker 

Durch den Einsatz von Tracking Blockern kann beim Sammeln von Daten die allgemeine Datenqualität beeinträchtigt werden, weil Lücken in den Profilen der Kunden entstehen – allen voran die Intelligence Tracking Preventions (ITP) von Apple, die Drittanbieter-Cookies nach bestimmter Zeit automatisch entfernen.

  • Plattform-Beschränkungen 

Google, Apple, Amazon und mehr werden zunehmend restriktiver bei der Herausgabe von Daten. Diese Einschränkungen können die Prozesse schwächen, um genaue und vollständige Daten zu sammeln.

Zusammengefasst: 5 Gründe warum du dich jetzt kümmern solltest

  1. Die Auktionslogik der großen Werbeplattformen Google, Meta, Amazon die Werbekosten immer weiter in Richtung Grenzkosten treibt.
  2. Die Plattformen immer weniger Daten preisgeben und stattdessen immer mehr Conversion-Daten modellieren.
  3. Die Datenqualität aufgrund von DSVGO, ITP & Co. grundsätzlich schlechter wird.
  4. Die Kontaktpunkte aufgrund von Multi-Device Journeys mehr werden.
  5. Du ansonsten selbst die Kontrolle verlierst.

Das eigene E-Commerce Data Warehouse als Lösung

Bevor du dich aber an ein eigenes Data Warehouse machst, steht die Konzeption des Dashboards im Vordergrund – also welche Datenquellen im DWH vereint werden sollen. Ein gutes Dashboard sollte vor allem die Wirtschaftlichkeit eines spezifischen Produkts oder einzelnen Varianten sowie Hersteller und Warenbereiche aufzeigen können. Ebenfalls muss die Effizienz der Absatzkanäle, einzelner Kampagnen und Zielgruppen einsehbar sein, wofür folgende Datenbestände herangezogen werden:

Produkte & Sales: Produktdaten (z.B. Shopping Feed), Bestelldaten (auf Positionsebene) und verwendete Coupons/Freebies. 

Deckungsbeiträge & Retouren: Retouren je Bestellung / auf Artikelebene, Einstandspreise je Artikel, Kostendaten Logistik & Payment je Bestellung (oder pauschal) und weitere Umlagen/Provisionen. 

Marketing: Alle (paid) Marketing-Statistiken segmentiert nach Produkt bzw. Landingpage und ergänzt um Leistungsmetriken. 

Nutzerverhalten: Session-Statistiken als Bindeglied zwischen Marketing-Kontakt und Sale z.B. Google Analytics Rohdaten oder eigene Erhebungen und ggf. Kundeninformationen wie Segmente.

Warum ein eigenes Data Warehouse statt vorgefertigter Systeme?

Wenn du nach einem Anbieter für ein Data Warehouse suchst, findest du zwar verschiedene Optionen, musst jedoch in einigen Aspekten Kompromisse bei den Systemen eingehen. Tools wie Funnel.io oder Supermetrics können Daten transportieren und formatieren, erfordern jedoch eine selbstständige Strukturierung.

Business Intelligence Tools wie Salesforce Marketing Cloud oder Adobe Experience Cloud bieten Dir umfangreiche Lösungen, erfordern jedoch eine komplexe Einarbeitung und sind keine günstigen Lösungen. Außerdem müssen weitere Anpassungen wie die Erstellung von benutzerdefinierten Dashboards, die auf die Bedürfnisse des Unternehmens zugeschnitten sind, vorgenommen werden. Spezifische KPIs, Zielgruppen oder Geschäftsbereiche können hier die jeweiligen Ausrichtungen sein, die eine individuelle Konfiguration erfordern.

Data Warehouse-Systeme wie Kissmetrics oder Triple Whale behandeln grundlegende Fragestellungen, sind jedoch limitiert in Kompatibilität und Individualisierbarkeit. Darüber hinaus sind bestehende Systeme oft kostspieliger. Aus diesen Gründen ist es empfehlenswert, ein eigenes Data Warehouse zu erstellen.

Vorteile eines eigenen Data Warehouses & 1st-Party Data

Das Anlegen eines eigenen Data Warehouses wird als 1st-Party Data Collection bezeichnet, da die Daten direkt aus den eigenen Quellen bezogen werden. Als Best Practice für das Data Warehousing empfehlen wir, eine eigene Datenbasis aufzubauen und nicht externe Daten per “live Abruf” ins Data Warehouse einzubinden. Denn für eine 1st-Party Data Collection gibt es gute Gründe:

  • Rundumblick & individuelle Perspektiven 

Die Integration verschiedener Perspektiven führt in der Praxis bspw. bei der Kombination aller Marketing- und Umsatzdaten zu neuen Einsichten.

  • Individuelle Erweiterungen

Du hast die Möglichkeit, Erweiterungen nach deinen Bedürfnissen hinzuzufügen, wie zum Beispiel Mitbewerber-Preisanalysen zur Optimierung deiner Kanal- und individuellen Werbesteuerung oder automatisches Pricing.

  • Datenhoheit & sensible Daten 

Informationen aus der Datenbank zu Einkaufspreisen, Deckungsbeiträgen oder Rentabilität einzelner Marketing-Kanäle bleiben in deiner eigenen Hoheit. 

  • Automatisierte Prozesse 

Ein eigenes Data Warehouse bietet die Grundlage für z.B. individuelle Sortimentsanalysen oder Saisonanalysen bei der Marketing-Automation. 

Die Entscheidung für den Aufbau eines E-Commerce Data Warehouses ist daher keine einfache „Make or Buy“ Entscheidung, sondern eine Kombination aus beidem. Denn das Erstellen eines eigenen Data Warehouses bietet Vorteile wie die Integration der eigenen Business-Logik und Anpassung an die Anforderungen des Shops. Ebenso ermöglicht der Kauf bestehender Systeme direkten Zugang zu generischen Komponenten sowie Werkzeugen. Diese erleichtern den Transfer und die Umwandlung von Daten (ETL-Tools oder API-Anbindungen), die Implementierung von Speicher- und Datenbank-Services (Data Lake) und die übersichtliche Darstellung mit Visualisierungstools.

Der Weg zum perfekten Report mit eigenem Data Warehouse

Damit du optimal in dein eigenes Data Warehouse startest, kannst du dich an folgenden Tipps orientieren.

  1. Datenhoheit gewinnen 

Daten an der Quelle abfragen, wo sie entstehen. 

  1. Eigene Datenbank aufbauen 

Somit erstellst du eine zentrale Datenbank, von der du Datenbestände für Analyse-Zwecke abfragen kannst. Aus der Praxis nutzen wir in der Agentur BigQuery von Google.

  1. Datenmodelle etablieren 

Dazu zählt die Transformation der Daten in ein abstrahierendes Datenmodell, wo du deine eigene Perspektive und Anpassungen miteinbringen musst. Hierfür kann eine eigene Logik implementiert werden. Für diesen Schritt erleichtern einem ETL-Tools wie z.B. Adverity das Leben sehr.

  1. Reporting visualisieren 

Im letzten Schritt kannst du die zunächst abstrakten Datenmengen und Analysen mit Looker, Power BI oder Tableau visuell aufbereiten.

Tipps für den Start

Als wir in 2021 das erste Mal ein E-Commerce Data Warehouse für einen unserer Kunden realisiert haben, war dies ein spannendes und lehrreiches Unterfangen. Wir wussten, wo wir hinwollten und hatten einen Plan, aber wie so oft sind Theorie und Praxis zwei Paar Schuhe.

Diese Tipps sind wohl gemeinte Ratschläge:

  1. 80/20

Klein anfangen und einfach denken. Nicht zu viel am Anfang wollen

  • Das Rad nicht neu erfinden

Wo es sinnvoll ist, nutzt Tools. Niemand muss den Datenabruf und die Transformationen selber machen. Tools erleichtern euch die Arbeit und ihr müsst euch nicht um die Wartung dieser kritischen Komponenten kümmern, wenn sich APIs von Zulieferern ändern.

  • Struktur, Struktur, Struktur

Standardisierte Datenmodelle sind der Schlüssel. Baut standardisierte, aber erweiterbare Datenmodelle, um eure Struktur zu finden und Aufwände zu minimieren

  • Visualisierung

Für den Start reichen die Visualisierungsmöglichkeiten von Google Lookerstudio oder Microsoft Power Bi vollkommen. Wer ein wenig mehr will, greift auf Tableau zurück.

  • Selber denken

Der wichtigste Tipp zum Schluss. Dein E-Commerce Datawarehouse bildet deine Business-Logik ab. Nur du weißt, welche Logiken hier einfließen. Wie werden Coupons verbucht, über welchen Zeitraum Storno? Werden B2B-Bestellungen auch über den Shop abgewickelt, müssen aber anders in der Auswertung behandelt werden? Kein Tool kann dir das Denken abnehmen. All-in-One Lösungen funktionieren nicht. Individuelle Fragestellungen können in standardisierten, aber nicht erweiterbaren Tool-Lösungen nur zu unzureichend bedient werden. Baust du hingegen dein Datenmodell auf deine Business-Logik auf, bist du super flexibel.

In a Nutshell: Argumente für ein eigenes E-Commerce Data Warehouse

Dein E-Commerce Data Warehouse hilft dir dabei…

  1. Werbekosten je Produkt / Produktgruppen / Sortimente zu analysieren und performancebasierte Entscheidungen abzuleiten.
  2. Absatz-Opportunitäten zu erkennen und zu nutzen, sofern Wettbewerber-Preise, Saisonalitäts- und/oder Wetterdaten vorliegen.
  3. Asset-Gruppen zu bilden, um für die weniger steuerbaren Ad-Formate wie P-Max bei Google oder Advantage+ bei Meta gerüstet zu sein.
  4. Höhere Akzeptanz und Sicherheit bei der Verteilung des Online Marketing Budgets auf Management-Ebene zu erzielen.
  5. Die Performance von Online-Kanälen besser beurteilen zu können und zu optimieren.
  6. Kunden-Kohorten auszuwerten und der Bestimmung eines Customer-Lifetime-Value näher zu kommen.

Wenn du Fragen zum Vorgehen hast und wie du in eurem Unternehmen ein eigenes Data Warehouse implementierst, dann nimm gerne Kontakt mit uns auf. Gemeinsam können wir besprechen, welche Anforderungen du hast und ob ein individuelles Data Warehouse die richtige Lösung wäre.

Marek Wriedt ReachLab

Marek Wriedt

COO & Head of Digital Analytics
Marek ist COO und Head of Digital Analytics von ReachLab. Er baut Data Warehouses und wird bei umfangreicheren Tracking-Projekten als Berater hinzugezogen. Zuletzt erarbeitete Marek Prozesse für den Aufbau von serverseitigen Tracking-Setups und treibt innerhalb der Agentur Prozessoptimierungen sowie Automatisierungen von Qualitätssicherungs-Tasks voran. In seiner Freizeit reist Marek viel, allen voran auf seine Lieblingsinsel Madeira.
Weitere Beiträge