Talend Forum
Talend Open MDM - Druckversion

+- Talend Forum (http://www.talendforum.de)
+-- Forum: Talend Open MDM (/forum-12.html)
+--- Forum: Allgemeines (/forum-14.html)
+--- Thema: Talend Open MDM (/thread-18.html)


Talend Open MDM - martin - 10.02.2010 18:53

Mit dem Jahreswechsel 2009 auf 2010 wurde von der Firma Talend eine neue (dritte) Lösung im Bereich Master Data Management veröffentlicht. Bei dieser Lösung handelt es sich um einen Produktzukauf der Firma Amalto und wurde im Rahmen eines Entwicklungsprozess komplett auf Open Source umgestellt. Wie auch bei den bisherigen Lösungen (Open Studio / Integration Suite, Open Profiler / Data Quality) gibt es neben der GPL v2 Variante auch die kostenpflichtige Talend Enterprise MDM Variante. Dieser Beitrag soll kurz das Thema MDM und die damit verbundenen Talend Aspekte darstellen.

Was ist MDM?
MDM steht als Abkürzung für Master Data Management. Vereinfacht kann man MDM als zentrale unternehmensweite Stammdatenverwaltung sehen. Historisch bedingt werden Stammdaten innerhalb von Unternehmen an n-fachen Stellen gespeichert und gepflegt. Während z.B. die Fakturen in einem ERP-System (Navision, SAP, …) erstellt und verarbeitet werden, so kann die logistische Abwicklung in einem ganz anderen System erfolgen. Dennoch implizieren die Rechnungsstellung und der Versand immer den Begriff Kunde, welcher in diesem Zusammenhang mit einer Adresse verbunden ist. Änderungen an der Anschrift erfolgen hierbei an zwei unterschiedlichen Stellen und erfordern somit auch einen doppelten Aufwand. Ferner lassen sich mittels MDM auch physische Strukturen abbilden und zu logischen Sichtweisen verknüpfen. Ein Kunden hat normallerweise nicht nur eine Anschrift sonder kann über mehrere Anschriften verfügen und diese werden im Regelfall in verschiedensten Tabellen abgelegt. MDM legt hierbei eine abstrahiert Sichtweise über den allgemeinen Begriff Kunde.
Allerdings ist hierbei zu berücksichtigen, dass MDM nicht für Massendaten (z.B. Fakturen, Aufträge, …) konzipiert wurde, sondern vielmehr die unternehmerischen Aspekte einer zentralen Verwaltung abdeckt. Man spricht hier auch von dem s.g. „golden Record“. Neben der zentralen Verwaltung, wird auch eine Protokollierung der geänderten Datensätze mitgeführt. Dies erfordert u.A. auch eine Benutzersteuerung auf „Feldebene“.
Wie bei jeder „neuen“ Technologie gibt es auch für MDM eine neue Sprachdefinition, die für Talend nochmals abstrahiert werden muss. In der folgenden Tabelle ist der Standardterminus, die Talend Definition und eine allg. Übersetzung beschrieben.



StandardTalendÜbersetzung
Data clusterData containerDie Datenbank, in der die Stammdaten/Datensätze (Änderungen, Wer, wann, …) abgelegt werden.
TransformerProcessIm Kern ist der Process letztendlich für die Ausführung/Publikation von Datensatzänderungen verantwortlich. Ein Process kann u.A. auch einen Talend-Job ausführen.
Routing ruleTriggerBedingungen die Aufgrund von Änderungen innerhalb der MDM Umgebung ausgeführt werden. Ein Trigger steuert durch die definierte Bedingung (True/False) dann einen Process.
UniverseVersionEin Datensatz kann in mehreren Versionen vorliegen. Die Version identifiziert hierbei an dieser Stelle die Änderungen.
ConceptEntityIm Kern die abstrahierte und unterste Sichtweise auf den „Datensatz“. Man kann hier auch von der Beziehung der Daten zueinander sprechen.
Data objectEntitySiehe Concept
ItemRecordDer physische Datensatz, bezogen auf die Entität, selbst.
WorbenchStudioDie Oberfläche mit der sich die MDM Lösung betreiben, definieren und umsetzen lassen. TMDMCE-All-rXXXXX-VX.X.X
Subscription engineEvent ManagerEin im Hintergrund laufender Dienst, welcher für die Verteilung von Events(Trigger, Process), die Protokollierung und das Monitoring verantwortlich ist
SchematronValidation ruleEin Reglwerk, welches direkt auf die Entity gelegt werden kann. Z.B. nur numerisch, maximal 10 Zeichen, …

MDM Projekte bestehen im Regelfall aus 20% Software und 80% Beratung. Aufgrund des Kostenaspekts und der Komplexität, kann eine MDM-Einführung nur mit Unterstützung der Geschäftsleitung zu einem erfolgreichen Abschluss geführt werden.

Wofür kann ich MDM einsetzen?
Stammdaten lassen sich in einer zentrale Instanz erfassen, verwalten, aus unterschiedlichsten Systemen extrahieren und in abhängige Applikationen verteilen.
- Artikelstamm steht sowohl in dem ERP-System aber auch im DWH zu Verfügung
- Entitäten lassen sich 1:1 mit unterschiedlichen Sprachen versehen (Klant = Debitor = Kunde)
- Das Objekt Kunde besteht aus Informationen des CRM’s (z.B. Anschrift, Ansprechpartner, …) und dem ERP (z.B. Umsatz, Mahnstufe,…)
- Verkaufsgebiete lassen sich zentral neu zu ordnen
- …

In diesem Zusammenhang sei gesagt, dass mittels MDM auch Überprüfungen bereits existierender Datensätze (Doublicates) und abhängiger Referenzen (Gibt es die Stadt überhaupt) implementiert werden können.

Was bedeutet das?
Sollten nach einer kostengünstigen und einfachen Alternative für die Stammdatenverwaltung gesucht werden, so sollte Talend Open MDM durchaus in Betracht gezogen werden. Dennoch sollte an dieser Stelle der Aufwand nicht unterschätzt bzw. vernachlässigt werden. Für die Definition von Entitäten und Prozesse gibt es zwar die Lösung Talend Open MDM, dennoch müssen gerade die notwendigen Befüllung-/Verteilungsprozesse weiterhin mit Open Studio implementiert, manuell verteilt und integriert werden. An dieser Stelle sei auch angemerkt, dass dieser Aufwand der kommerziellen Variante reduziert werden kann.
Zusätzlich sollte immer berücksichtig werden, dass ein MDM Projekt weitaus mehr Aufwand als die Implementierung eines DataWarehouses verschlingen kann.

Weitere Informationen:
Wikipedia MDM
Talend Open MDM Community Edition
Talend Open MDM Documentation

Martin