Bye-bye, Datensilos: Dein Weg zur Data Driven Company mit den Daten-Tools von Google Data Cloud

Damit sich Organisationen zu einer Data Driven Company entwickeln können, braucht es zwei wichtige Komponenten: eine Datenkultur und geeignete Technologien. Warum es wichtig ist, dass im gesamten (!) Unternehmen eine tragfähige Datenkultur etabliert wird, haben wir bereits in einem früheren Artikel erläutert. Heute legen wir unseren Fokus auf den zweiten Baustein, also die Daten-Tools. Sie sind essenziell, um erhobene Daten analysieren und auswerten zu können, was wiederum die Grundlage für bessere Entscheidungen bildet.

Vor der Entscheidung für bestimmte Tools zur Auswertung und Darstellung von Daten solltest du eine grundlegende Cloud-Daten-Infrastruktur schaffen, mit der du agil und flexibel arbeiten kannst. Wichtige Faktoren dabei: Du kannst einfach auf Tools zugreifen, zusätzliche Datenquellen unkompliziert anbinden und deine Datenmenge nach oben oder unten skalieren.

Arbeite datengetrieben – mit den Tools von Google Data Cloud.

Darum sind deine Daten in der Google Cloud gut aufgehoben

Und genau diese Anforderungen an deine Datenarchitektur kann dir Google Data Cloud bieten. Die vier wichtigsten Vorteile für dich auf einen Blick:

  • Keine Datensilos mehr: Technische Barrieren wie Datensilos verhindern, dass deine Mitarbeiter*innen auf sämtliche Daten deines Unternehmens zugreifen können. Dadurch entgehen ihnen Erkenntnisse, was zur Folge hat, dass viele Entscheidungen nur aus dem Bauch heraus getroffen werden können. Durch ein gemeinsames Data Warehouse in Google Cloud (BigQuery) wird das zukünftig vermieden.
  • Skalierende Infrastruktur: In der heutigen “Always-on-Welt” muss deine Infrastruktur skalierbar sein. Nur so kannst du schnell und flexibel auf die Kundennachfrage reagieren.
  • Spare Geld bei der Infrastruktur-Verwaltung: In der Cloud ist es – im Gegensatz zu On-Premise-Systemen – nicht mehr notwendig, dass sich deine Mitarbeiter*innen um den Betrieb und das Monitoring kümmern. Außerdem müssen sie sich nicht mehr mit dem Einkauf neuer Hardware und Lizenzen befassen, wenn sie auf Veränderungen reagieren wollen.
  • Unkomplizierte und schnelle Datenanalysen: Wenn dein Unternehmen bislang noch keine geeigneten Daten-Tools verwendet, sind Datenanalysen zeitaufwändig und fehleranfällig. Die Tools von Google Data Cloud ermöglichen schnelle und einfache Analysen, mit denen du Marktveränderungen tatsächlich abbilden kannst.

Google Data Cloud liefert dir also in mehrfacher Hinsicht eine optimale Basis für deine Daten-Infrastruktur. Sie enthält eine ganze Reihe an verschiedenen Daten-, KI- und Machine-Learning-Tools, die dir dabei helfen, aus den von dir erhobenen Daten bessere Entscheidungen zu generieren. Damit deine Teams Daten-Tools sinnvoll bei ihrer Arbeit einsetzen können, müssen sie allerdings bestimmte Anforderungen erfüllen. Im Folgenden verraten wir dir, welche das sind.

Wieso müssen alle im Unternehmen mit Daten(-Tools) arbeiten können UND wollen?

Die Grundidee einer etablierten Datenkultur ist, dass sich nicht nur alle Mitarbeiter*innen deines Unternehmens für Daten begeistern können, sondern dass sie auch mit entsprechenden Tools und Anwendungen vertraut sind und sie in ihren täglichen Workflow einbinden. Das Ziel sollte also sein, dass sich alle Mitarbeiter*innen selbst mit den Informationen versorgen können, die sie benötigen – und keine Berichte mehr in expliziten Daten- oder Analyse-Teams anfordern müssen.

Um dieses Ziel, dass alle Mitarbeiter*innen selbstständig mit Daten(-Tools) arbeiten können und wollen, zu erreichen, müssen zwei wichtige Voraussetzungen gegeben sein:

1. Alle User müssen einfach auf die Technologien zugreifen können.
2. Alle User müssen Vertrauen in die Daten(-Tools) haben.

Einfacher Datenzugriff – dank Data Warehouse

Wieso stellt es ein echtes Problem dar, wenn du deine Daten an verschiedenen Orten sammelst und grundsätzlich nicht jede*r darauf zugreifen kann? Da wir heutzutage zahlreiche Datenquellen – IoT-Sensoren, Geschäftsanwendungen, Marketingdaten etc. – nutzen, passiert es häufig, dass Daten innerhalb eines Unternehmens in verschiedenen Silos gespeichert werden. Das führt jedoch dazu, dass die unterschiedlichen Teams mit verschiedenen Informationen oder duplizierten Datensätzen arbeiten müssen. Diese Arbeitsweise ist nicht nur sehr fehleranfällig, sondern sorgt auch für Lücken innerhalb der Daten.

Die Lösung ist ein sogenanntes Data Warehouse – also eine einzige Datenquelle (Single Source of Truth) für alle Daten einer Organisation, auf die jede*r zugreifen kann, wenn (und wie) es erforderlich ist. In Google Cloud fungiert die Software BigQuery als Data Warehouse, in dem all deine Daten gesammelt werden.

Richte ein Data Warehouse als einzige Datenquelle für alle Daten deiner Organisation ein.

Für den Durchblick im Data Warehouse sorgen

Und mit welchen Google-Cloud-Tools kannst du deine Datensammlung dann aufbereiten und auswerten? Zum Beispiel mit dem Tool Looker, eine Datenanalyse-Plattform mit Business-Intelligence-Funktionen, eingebetteten Analysen und Funktionen für Datenanwendungen. Hier entstehen Datenmodelle, die Daten von 10 bis 20 SaaS-Anwendungen oder über öffentliche Clouds hinweg zusammenführen können. Die App Dataflow vereint die Streaming- und Batch-Datenanalyse und erstellt zusammenhängende Daten-Pipelines. Mithilfe von Dataprep kannst du Daten schnell und visuell erkunden, bereinigen und vorbereiten, um sie bei Analysen oder maschinellem Lernen einzusetzen. Darüber hinaus enthält die Google Data Cloud noch viele weitere Produkte – hier findest du eine Übersicht.

Die Daten-Tools von Google Data Cloud sind natürlich nur eine von mehreren Möglichkeiten, die du in Betracht ziehen solltest. Grundsätzlich gilt: Wenn du und dein Unternehmen gerade auf der Suche nach geeigneten Technologien zur Datenanalyse sind, solltet ihr euch bei eurer Recherche die folgenden Fragen stellen:

  • Gibt es eine integrierte Ansicht der Daten deiner Organisation?
  • Können die User deiner Organisation die benötigten Daten leicht aufrufen?
  • Kann die Plattform Streaming-Daten in Echtzeit aufnehmen, ohne dein Budget zu überschreiten?
  • Kann die Plattform Datentypen aus verschiedenen Quellen verarbeiten?

Darum müssen alle den Daten(-Tools) vertrauen können

Kommen wir zur zweiten Voraussetzung: Was hat es mit dem Vertrauen in die Daten(-Tools) auf sich? Wenn Mitarbeiter*innen dazu angehalten werden, mit Daten zu arbeiten, um dadurch fundierte Entscheidungen zu treffen, müssen sie sich auch darauf verlassen können, dass diese Daten richtig, aktuell und von hoher Qualität sind.

Bei lokalen oder Legacy-Systemen werden die Daten häufig isoliert gespeichert und von Nutzer*innen so oft kopiert, bis es an vielen unterschiedlichen Stellen veraltete Systeme gibt. Dieses Vorgehen kann allerdings für die Datenqualität zum Problem werden, sobald sich die Datensätze vergrößern. Damit Personen Daten als vertrauenswürdig erachten, müssen solche ausgelagerten Datasets oder isolierten Projekte verbannt werden. Das kannst du, wie oben beschrieben, zum Beispiel durch ein gemeinsames Data Warehouse erreichen.

Damit Menschen Daten jedoch wirklich vertrauen, braucht es wesentlich mehr: Denn je mehr Daten du erfasst und analysierst, desto wichtiger werden Sicherheit und Governance. Unser Tipp für dich: Achte darauf, dass der Technology Stack deines Cloud-Anbieters in der Lage ist, die entsprechenden Sicherheits-Features bereitzustellen. Außerdem sollte er es dir ermöglichen, Metadaten, Datenkataloge und Datenherkunft zu nutzen, um deine Daten zu verwalten und Richtlinien festzulegen. Damit deine Teams effizient zusammenarbeiten können, sollte es darüber hinaus unkompliziert möglich sein, Zugriffsregeln festzulegen und eine sichere Datenfreigabe einzurichten.

Du siehst: Es ist besonders relevant, sich schon im Vorfeld zu überlegen, wie und welche Sicherheitspraktiken und -werkzeuge du implementieren willst. Google hat hierfür eine eigene Lösung: BeyondCorp ist eine Implementierung eines Zero-Trust-Sicherheitsmodells, bei dem Zugriffskontrollen von der Netzwerkumgebung auf individuelle User verschoben werden. Dadurch können User von jedem Ort aus ohne VPN sicher arbeiten. BeyondCorp umfasst Single-Sign-on (SSO), Access Proxy, Access Control Engine, User Inventory, Device Inventory, Sicherheitsrichtlinien und ein Trust Repository.

Quelle: Google Cloud, 2020

Dein Weg zur Data Driven Company

Es wird deutlich, dass das Vertrauen in Daten, Tools und Prozesse einen wichtigen Bestandteil der Datenkultur deines Unternehmens ausmacht. Dieser Faktor beeinflusst – ebenso wie der einfache Zugriff auf die Technologien – maßgeblich, ob Mitarbeiter*innen wirklich effektiv mit Daten(-Tools) arbeiten können und wollen.

Deshalb solltest du auf die richtige Datenarchitektur und geeignete Daten-Tools setzen, z. B. auf Google Data Cloud, die Tools wie BigQuery, Cloud Spanner, Looker oder Vertex für dich bereithält.

Du willst dich noch tiefer in die Thematik einarbeiten? Mehr dazu erfährst du im Whitepaper “Google's guide to building a data-driven culture“, das du dir hier herunterladen kannst.

Ab in die Google Data Cloud – mit Seibert Media!

Du interessierst dich für eine Migration zu Google Data Cloud oder willst dich intensiver über die dort enthaltenen Daten-Tools informieren? Dann melde dich bei uns! Wir beantworten dir gerne deine Fragen und unterstützen dich dabei, den Umzug in die Google Cloud zu evaluieren und umzusetzen.

Oder beschäftigst du dich bereits schon länger mit dem Thema “Daten”, weißt aber nicht so recht, wo du anfangen sollst? Dann ist unser Data Analytics Management Workshop vielleicht etwas für dich: Hier helfen wir dir dabei, eine eigene Daten-Infrastruktur aufzubauen, deine Datenquellen anzubinden, dein eigenes Data Warehouse einzurichten und hilfreiche Business Dashboards zu erstellen.

Weiterführende Infos

Das Rezept für ein datengetriebenes Unternehmen: Datenkultur + Daten-Tools von Google Data Cloud
Business Intelligence mit Google Cloud, Big Query und Data Studio
Datenanalyse in der Google Cloud mit BigQuery und Google Sheets
Soon to come: Neue Features in der Pipeline von Google Workspace