Daten Virtualisierung und Maskierung in Cloud Pak for Data

Wilfried Hoge
1 min readFeb 15, 2021

Informationen aus verschiedensten Quellen zusammen zu bringen ist mit Daten Virtualisierung leicht. Daten Silos lassen sich so aufbrechen und Anwender*innen die Daten auf einheitliche Weise zur Verfügung stellen. Die Daten Virtualisierung bildet dazu eine Schicht zwischen den Datenquellen und dem Zugriff auf diese.

Damit lassen sich Daten aus verschiedenen Quellen miteinander verknüpfen (join), Zugriffe vereinheitliche und Zugriffsrechte steuern. Allerdings sollen nicht alle Anwender*innen das Gleiche sehen. Bestimmte Felder, z.B. Kreditkartennummern, müssen geschützt werden können.

Dazu kann in der Daten Virtualisierung je Gruppe von Anwender*innen eine eigenständige Sicht auf die Daten erzeugt werden. Je nach Gruppe werden also Daten weggelassen oder transformiert. Durch eine Trennung der Definition des technischen Zugangs und der Sichtbarkeit, kann dieser zusätzliche Aufwand vermieden werden.

In Cloud Pak for Data wird die Sichtbarkeit der Daten über Regeln im Watson Knowledge Catalog gesteuert. Auf Basis unterschiedlichster Kriterien läßt sich dort konfigurieren, wer Daten sehen kann. Außerdem läßt sich definieren, dass Felder in bestimmten Situationen transformiert werden sollen. So lassen sich die Daten mit “x” überschreiben, oder unter Erhaltung des Formats mit anonymen Werten überschreiben.

Das folgende Video zeigt die Daten Virtualisierung in Cloud Pak for Data und wie eine Maskierung durch eine Regel erzeugt werden kann:

--

--

Wilfried Hoge

Analytics Architect at @IBM. Member of @D64eV, interested in Data Science, Data Lake, IoT and Machine Learning. My views are my own.