Europäische Datensouveränität: Datenplattformen mit Produkten aus Europa

09 Mär. 2026

10 Minuten Lesezeit

Ein Bild, das die euopäische Datenplattformen widerspiegeln soll.

Unternehmen, die eine langfristige Compliance, den Schutz der Privatsphäre und eine starke Daten-Governance anstreben, sehen sich mit einer Vielzahl von Datenschutzrisiken konfrontiert. Um die Angriffsfläche für solche Risiken zu minimieren, hat die EU diverse Gesetze erlassen. Vor dem Hintergrund aktueller politischer Ereignisse und des U.S. Cloud Acts wächst in diesen Organisationen der Wunsch nach europäischer Datensouveränität. Das reine Hosting auf europäischen Servern ist nicht mehr ausreichend. Um diesem Wunsch nachzukommen, ist meist ein Abwenden von den bekanntesten Anbietern für den Aufbau von Datenplattformen notwendig, da diese häufig außerhalb Europas ansässig sind. Daher lohnt sich ein Blick auf alternative Lösungen.

Steht die europäische Datensouveränität im Fokus, kann entweder in der EU gehostete Open-Source-Software (OSS) genutzt oder eine europäische Lösung gewählt werden. Bei der Nutzung von OSS sind Unternehmen selbst für Sicherheitspatches und den Betrieb verantwortlich. Möchten Unternehmen diese Verantwortung nicht eigenständig tragen, fällt die Suche nach einer europäischen Alternative häufig schwer. Dies bestätigt der Blick in die “Magic Quadrants” des (amerikanischen) Unternehmens Gartner zu den Themen “Analytics and BI Platforms” und “Cloud Data Management Systems aus dem letzten Jahr. Im Bereich der Leader sind fast ausschließlich amerikanische Unternehmen vertreten. Im magischen Quadranten zum Thema “Data Analytics Governance Plattform” erscheint Collibra als europäischer Leader. Dies ermutigt, Datenplattformen mit starken europäischen Produkten aufzubauen.

Fest steht jedoch: Wer die Big-Player aus den Nicht-EU-Ländern meiden möchte, muss sich teilweise auf weniger etablierte Lösungen einstellen oder mehr Arbeit investieren. In diesem Artikel skizzieren wir zwei Datenplattformen, die möglichst ausschließlich EU-Produkte oder OSS nutzen. Außerdem stellen wir ein Template zur Auswahl geeigneter Tools vor.

Template zur Auswahl einer geeigneten Datenplattform

Um die passende Datenplattform zusammenzustellen, müssen zuerst der Use Case bestimmt und die relevanten Rahmenbedingungen und Voraussetzungen festgelegt werden. Im Folgenden sind einige Fragen gesammelt, deren Beantwortung ein Startpunkt für die Definition ist.

  • Allgemeine Faktoren: Soll die Datenplattform in der Cloud liegen oder On-Prem sein? Kommen Open-Source-Lösungen infrage? Welcher Kostenrahmen ist vorgesehen? Werden bereits Produkte im Unternehmen genutzt, zu denen finanzielle, Know-How-technische oder organisatorische Synergieeffekte vorliegen? Soll ein Produkt gewählt werden, das einen ganzheitlichen Ansatz verfolgt, oder sollen verschiedene Produkte für jede Komponente gewählt werden? Ist Nachhaltigkeit bei der Software von Bedeutung? Spielen der Vendor-Lock-in und die Marktrelevanz eines Produkts eine Rolle?

  • Anforderungen und Beschaffenheit der Daten: Welches Konsistenzlevel, welche Latenzzeit bei der Datenanalyse, welche Skalierbarkeit und welche Verfügbarkeit der Daten werden benötigt? Müssen strukturierte und/oder unstrukturierte Daten verarbeitet werden? Soll Self-Service BI ermöglicht werden?

  • Wartung: Wie kann die langfristige Wartung sichergestellt werden? Ist das Unternehmen groß und hat das notwendige interne Wissen, um die Wartung zu gewährleisten? Liegen bereits Wartungsverträge vor?

  • Governance/Compliance: Gibt es interne Richtlinien, geltende Gesetze oder Datenschutzvorgaben, die eingehalten werden müssen? Werden europäische Produkte bevorzugt?

Diese Faktoren können in das folgende Template eingetragen werden. Anschließend kann man für jeden Datenverarbeitungsschritt eine passende Lösung auswählen. Je nach Anwendungsfall ist es aber auch denkbar, einzelne Komponenten wegzulassen oder erst zu einem späteren Zeitpunkt einzuführen.

Template für eine Referenzplattform
Bild 1: Template für eine Referenzplattform

Beispiel für eine auf OSS basierende Datenplattform

Wenn im Unternehmen das passende Know-how vorhanden ist, muss es sich nicht auf europäische Lösungen beschränken, sondern kann auch auf OSS zurückgreifen. Viele der Open-Source-Tools sind mittlerweile in verschiedenen Branchen verbreitet und haben sich in der Praxis bewährt. Die nachfolgend aufgeführten Tools wurden ausgewählt, da sie für eine On-Premise Datenplattform mit vorwiegender Batchverarbeitung gut geeignet sind. Es handelt sich nur um eine kleine Auswahl gängiger Produkte:

  • dltHub ist eine Python Library, die eine Anbindung und Datenübertragung zwischen verschiedensten DB-Systemen unterstützt.

  • Apache Airflow ist ein Tool zur Orchestrierung, Planung und Überwachung von Daten‑Workflows. Sie ist flexibel anpass- und erweiterbar, wodurch sie auch für komplexere Anwendungsfälle geeignet ist.

  • dbt (data build tool) ist im Kern ein in Python geschriebenes Tool zum Erstellen und Verwalten von SQL-Transformationen. Auch für größere Datenmengen hat es sich als performant erwiesen.

  • Jupyter Notebook ist eine Webanwendung zur interaktiven Datenanalyse, Visualisierung und Dokumentation von Code. Sie wurde herausgegeben von der Non-Profit-Organisation Project Jupyter.

  • PostgreSQL ist ein leistungsfähiges, relationales Datenbanksystem. Es unterstützt SQL-Standards und eignet sich für große Anwendungen mit vorwiegend strukturierten Daten. Aber auch weniger strukturierte Daten können unterstützt werden. PostgreSQL ist für seine Datenintegrität bekannt und ACID compliant.

  • Amundsen ist ein Datenkatalog zur Verbesserung der Auffindbarkeit und Dokumentation von Daten. Er unterstützt Metadatenmanagement und Data Discovery in Datenplattformen.

  • DataHub ist ein Produkt für Metadatenmanagement und Data Governance. Es ermöglicht Transparenz über Datenherkunft, Nutzung und Abhängigkeiten in komplexen Datenlandschaften.

  • git ist ein verteiltes Versionsverwaltungssystem, um Änderungen an Dateien, insbesondere Quellcode, effizient zu verfolgen und zu verwalten. Es bildet die Grundlage für kollaborative Softwareentwicklung und DevOps‑Prozesse.

  • Prometheus ist ein Monitoring‑System zur Erfassung und Auswertung von Metriken. Es wird vor allem zur Überwachung von Anwendungen und Infrastrukturen genutzt.

  • Grafana wird zur Visualisierung von Metriken, Logs und Traces in Dashboards genutzt. Das Unternehmen Grafana Labs gehört zu Qlik und ist in den USA ansässig.

Datenplattform mit Open-Source-Tools
Bild 2: Datenplattform mit Open-Source-Tools

Eine Datenplattform lässt sich grundsätzlich vollständig aus Open‑Source‑Lösungen zusammenstellen. Dies ermöglicht technologische Unabhängigkeit und flexible Anpassbarkeit an individuelle Anforderungen. Zu den Vorteilen zählen neben der Vermeidung von Vendor Lock‑in auch eine aktive Community und in vielen Fällen geringere Lizenzkosten. Nachteile können jedoch ein höherer Integrations‑, Betriebs‑ und Wartungsaufwand sowie der Bedarf an internem technischem Know-how sein, da Support und langfristige Verantwortung häufig bei Anwender:innen selbst liegen.

Beispiel für eine Datenplattform basierend auf EU-Produkten

Der Fokus der zusammengestellten Datenplattform besteht darin, Produkte aus rein europäischer Hand zu nutzen – dabei dürfen die Daten der Produkte sowohl On-Premise als auch in einer europäischen Cloud gespeichert werden. Von entscheidender Bedeutung sind der Hauptsitz und die Besitzverhältnisse des Unternehmens, denn unter diesen Bedingungen gilt europäisches Recht. Folgende europäische Datenprodukte sind hierbei interessant:

  • KNIME wird vom schweizerischen Unternehmen KNIME AG mit Hauptsitz in Zürich, Schweiz angeboten. Es kann dabei diverse Schritte der Datenverarbeitung, z. B. Datenanalyse, grafische Workflow-Modellierung, übernehmen und bietet verschiedene Konnektoren zu etablierten Lösungen an, unter anderem zu SAP. Es ist vor allem für kleinere Anwendungsfälle geeignet.

  • Jedox ist eine Software, um Finanzdaten zu visualisieren. Laut Gartner zählt es 2025 zu den Leadern im Bereich “Financial Planning Software”. Es bietet ebenfalls diverse Konnektoren an. Das Unternehmen Jedox GmbH ist in Freiburg im Breisgau, Deutschland, ansässig.

  • Jupyter Notebook ist eine Open-Source‑Webanwendung zur interaktiven Datenanalyse, Visualisierung und Dokumentation von Code. Sie wurde herausgegeben von der Non-Profit-Organisation Project Jupyter.

  • Toucan ist eine Analytics‑ und Data‑Storytelling‑Plattform zur Erstellung interaktiver Dashboards für Business-Anwender:innen. Es gehört zu einem inhabergeführten Unternehmen aus Frankreich.

  • SAP Hana ist eine spaltenbasierte In-Memory-Datenbank des deutschen Unternehmens SAP mit Hauptsitz in Walldorf, Deutschland. Laut Gartner zählt SAP zu den Leadern im Bereich “Integration Platform as a Service”.

  • EXASOL ist eine hochperformante Analyse-Engine und In-Memory-Datenbank. Der Hauptsitz des Unternehmens EXASOL AG ist in Nürnberg, Deutschland.

  • Collibra ist eine führende, cloudbasierte Plattform für Data Governance, Datenkatalogisierung und Datenqualität. Das Unternehmen ist inhabergeführt und hat seinen Hauptsitz in Brüssel, Belgien. Laut Gartner zählt es zu den Leadern im Bereich “Analytics and BI Platforms” und “Cloud Data Management Systems”.

  • GitLab ist eine DevOps‑Plattform für Versionsverwaltung, CI/CD und kollaborative Softwareentwicklung auf Git-Basis. Das Unternehmen wurde ursprünglich in den Niederlanden gegründet, auch wenn es heute international operiert und seinen Sitz in die USA verlegt hat.

  • ZABBIX ist eine Plattform für Monitoring und Observability von IT‑Infrastrukturen, Netzwerken und Anwendungen. Das Unternehmen Zabbix SIA hat seinen Sitz in Riga, Lettland.

Datenplattform mit europäischen Lösungen
Bild 3: Datenplattform mit europäischen Lösungen

Es ist durchaus denkbar, eine Datenplattform zusammenzustellen, die nur auf europäischen Tools basiert. Im Bereich der Versionierung und Deployment ist gegebenenfalls ein Rückgriff auf etablierte Open-Source-Lösungen sinnvoll. Viele der genannten Produkte bieten zahlreiche Konnektoren zu anderen Softwarelösungen an, wobei der Fokus derzeit noch überwiegend auf großen Anbietern aus Nicht‑EU‑Ländern liegt. Künftig sollte die Integration und Vernetzung europäischer Produkte stärker vorangetrieben werden, um eine durchgängig integrierte und handhabbare Systemlandschaft zu schaffen. Gleichzeitig ist zu berücksichtigen, dass ein höheres Maß an Datensouveränität teilweise mit erhöhten Kosten sowie einem größeren Wartungs- und Betriebsaufwand einhergeht.

Identifikation von europäischen Lösungen

Für die Identifikation von europäischen Lösungen sind wir folgendermaßen vorgegangen: In Deutschland besteht für fast alle geschäftsmäßig, gewerblich oder journalistisch-redaktionell gestalteten Webseiten eine Impressumspflicht. Dies verpflichtet Unternehmen, auf ihren Produktwebseiten die zuständige Firma einschließlich ihrer Rechtsform und die Vertretungsberechtigten anzugeben. Es ist ebenfalls verpflichtend, dass der Reiter auf der Webseite, in dem die Informationen zu finden sind, “Impressum” heißt. Das europäische Pendant ist die EU-E-Commerce-Richtlinie, die verlangt diese Informationen leicht zugänglich bereitzustellen (häufig unter “Kontakt”, “Über uns” oder “Rechtliche Hinweise”). Findet man diese Informationen nicht auf der Produktwebseite, handelt es sich nicht um europäische Produkte.

Danach kann für deutsche Unternehmen ins Handelsregister geschaut werden, um zu prüfen, wem eine Firma gehört. Das europäische Pendant zum Handelsregister ist das System zur Verknüpfung von Handelsregistern (BRIS - Business Registers Interconnection System), das über das Europäische E-Justizportal zugänglich ist.

Folgende Kriterien helfen dabei, ein Produkt einzuordnen:

  • Wo liegt der Firmensitz und welche Rechtsform hat das Unternehmen?

  • Existiert eine außereuropäische Muttergesellschaft?

  • Welche rechtlichen Vorgaben stehen in den AGBs?

  • Wo werden die Daten gehostet?

  • Werden Support und Subprozesse ebenfalls vom Unternehmen selbst übernommen?

Fazit

Um die für das eigene Unternehmen optimale Datenplattform zu bestimmen, spielen der Use Case und die Rahmenbedingungen eine wichtige Rolle. Die optimalen Tools für den Anwendungsfall sind immer der bestmögliche Kompromiss unter den gegebenen Umständen, eventuell unter einer bestimmten Gewichtung der verschiedenen Rahmenbedingungen. Legt man einen Fokus auf europäische Lösungen oder Open-Source-Produkte, riskiert man zwar einen höheren Aufwand, z. B. durch den eigenen Betrieb und die Wartung der Plattform, oder höhere Kosten – gewinnt aber eine enorme Datensouveränität. Gerade in der heutigen politischen Lage ist die Frage “Wie viel strategische Abhängigkeit von Nicht-EU-Ländern wollen wir zulassen, um den Aufwand zu reduzieren?” brandaktuell. Die oben aufgelisteten Referenzplattformen zeigen jedoch, dass es durchaus möglich ist, Datenplattformen mit möglichst geringem außer-europäischen Einfluss zu erstellen ohne Produkte im Eigenbau entwickeln zu müssen.

Wenn Ihnen dieser Artikel gefallen hat, lesen Sie auch gerne weitere Artikel zum Thema Datensouveränität auf unserem Blog:

Wenn Sie auf der Suche nach einer passenden Datenplattform für Ihr Unternehmen sind, sprechen Sie uns gerne an – wir unterstützen Sie bei der Auswahl und Umsetzung geeigneter Lösungen.

Nächster Artikel

Integrationstests mit Windows in der GitHub CI/CD Pipeline

Integrationstests mit Windows in der GitHub CI/CD Pipeline.