Blog PIKON Deutschland AG

Stammdatenbereinigung: Innovationen in der Dublettenerkennung

Ihor Hetman
August 24, 2023
5 Minuten

Duplikaterkennung in Kunden- und Lieferantenstammdaten

Im Artikel zeige ich auf, wie Data Science bei der Erkennung von Duplikaten in den Lieferanten- und Kundenstammdaten unterstützen kann. Die Daten-Deduplizierung, ein wesentlicher Prozess im Datenmanagement, umfasst die Identifizierung und Beseitigung von doppelten Datensätzen, um Datenpräzision, Konsistenz und Zuverlässigkeit sicherzustellen. Mehr Informationen zum Thema Data Literacy erfahren Sie im Artikel „Warum Data Literacy essenziell für Unternehmen ist„.

In diesem Blog werde ich Sie durch eines unserer Projekte führen, in dem Künstliche Intelligenz (KI) zum Einsatz kam und uns das Potenzial der Datenbereinigung mit KI im Stammdatenmanagement gezeigt hat.

Warum ist Daten-Deduplizierung wichtig?

In der heutigen schnelllebigen und datengetriebenen Welt stehen Organisationen vor einer enormen Herausforderung – dem Management großer Mengen von Stammdaten. Ob es sich um Kundendaten, Lieferanteninformationen oder Materialstämmen handelt, die Aufrechterhaltung genauer und zuverlässiger Stammdaten ist ein kritischer Faktor in Unternehmen. Allerdings gelangen oft doppelte Datensätze aufgrund von Fehlern bei der manuellen Dateneingabe, unterschiedlichen Datenquellen und Datenmigrationen in Datenbanken. Mit zunehmendem Volumen der Stammdaten erweisen sich herkömmliche manuelle Deduplizierungsmethoden als unzureichend und zeitaufwändig. Die Entwicklung einer KI-Lösung für die Daten-Deduplizierung im Stammdatenmanagement bietet sich an, um den Problemen der manuellen Prüfung zu begegnen.

Unter SAP S/4HANA wurde das Konzept des Geschäftspartners (Business Partner) eingeführt. Hier werden zentral die Stammdaten für Geschäftspartner, Kunden und Lieferanten verwaltet. Wenn Organisationen vor der Herausforderung einer Datenmigration stehen, nimmt die Daten-Deduplizierung eine besondere Bedeutung ein. Der Migrationsprozess bietet eine einzigartige Gelegenheit zur Bereinigung und Harmonisierung von Daten, um einen nahtlosen Übergang zum neuen Business Partner Konzept zu gewährleisten.

Die Workflow-Struktur unserer KI-Lösung zur Daten-Deduplizierung

Der Workflow dieser KI-Lösung besteht aus mehreren Schritten, die jeweils zur Identifizierung und Bereinigung von duplizierten Kunden- und Lieferantenstammdaten beitragen.

Extrahieren von Kunden- und Lieferantenstammdaten

Der Prozess beginnt mit dem Extrahieren von Kunden- und Lieferantenstammdaten. Dies umfasst das Abrufen von Informationen aus verschiedenen Quellen, wie Datenbanken und CRM-Systemen, und die Zusammenführung in einer einzigen Datei.

Datenanalyse

Die KI-Lösung führt Datenanalysen durch und taucht tief in die Daten ein, um Muster, Verteilungen und potenzielle Duplikate zu identifizieren. Diese aufschlussreiche Analyse hilft dem Data-Science-Team, die kundenspezifischen Daten zu verstehen.

Aufbereitung der Daten

Die Aufbereitung der Inputdaten ist ein entscheidender Schritt, der die Datenkonsistenz gewährleistet. In dieser Phase bereinigt die KI-Lösung die Daten, verarbeitet ungewöhnliche Daten und standardisiert Formate. Durch sorgfältige Vorbereitung der Inputdaten legt das KI-System den Grundstein für eine präzise und zuverlässige Deduplizierung.

Erstellung von Eingabenattributen für Machine-Learning-Modelle

Nach Abschluss der Datenanalyse geht die KI-Lösung dazu über, Duplikate in den Originaldaten zu identifizieren. Dieser Schritt umfasst den Vergleich von Datensätzen und die Verwendung von Ähnlichkeitswerten, um potenzielle Duplikate zu bewerten.

Vorhersage basierend auf Machine-Learning-Modellen

Das Herzstück des KI-Systems basiert auf den komplexen Machine-Learning-Modellen. Durch den Einsatz modernster Algorithmen werden potenzielle doppelte Datensätze identifiziert. Diese Machine-Learning-Modelle sind darauf trainiert, selbst subtile Ähnlichkeiten und Abweichungen zu erkennen, was eine präzise Deduplizierung ermöglicht.

Darstellung der erzielten Ergebnisse

Die KI-Lösung hört bei der Deduplizierung nicht auf. Sie geht einen Schritt weiter und bindet den Nutzer aktiv in den Prozess ein. Die Ergebnisse werden so aufbereitet dargestellt, dass Sie die Deduplizierungsergebnisse verstehen können und fundierte Entscheidungen auf Grundlage der Dateninformationen treffen können.

Validierung und menschliche Überprüfung

Obwohl die KI-Lösung eine automatisierte Deduplizierung durchführt, ist es wichtig, menschliche Überprüfungen für die Validierung mit einzubeziehen. Datenverantwortliche oder Datenmanagement-Teams überprüfen die deduplizierten Datensätze, um die Genauigkeit der KI zu gewährleisten. Dieser Schritt fügt eine Sicherheitsebene hinzu und verfeinert die Deduplizierungsergebnisse.

Welche Vorteile bietet dieses Projekt für Sie?

Verbesserung der Datenqualität – zum Beispiel vor der S/4HANA-Migration

Die KI-Lösung für die Deduplizierung gewährleistet Datenintegrität während der kritischen Migration in S/4HANA Projekten. Durch die Beseitigung von Duplikaten verbessert sie die Konsistenz der Daten.

Reduzierung der Zeit für die Suche nach Duplikaten

Durch den Einsatz von Machine-Learning-Algorithmen optimiert die KI-Lösung die Suche nach Duplikaten, spart Zeit und Aufwand.

Automatisierung des Deduplizierungsprozesses

Die KI-Lösung automatisiert den gesamten Deduplizierungsprozess von der Datenanalyse bis zur Ergebnisliste mit Duplikaten, minimiert menschliche Fehler und verbessert die Genauigkeit der Daten.

Bereitstellung von Erkenntnissen für die Datenverantwortlichen

Mit fortschrittlicher Analytik ermöglicht die KI-Lösung den Datenverantwortlichen Informationen, die datengetriebene Maßnahmen und evidenzbasierte Entscheidungsfindungen unterstützen.

Fazit zum Projekt "Stammdatenbereinigung"

Zusammenfassend steht das Projekt „Stammdatenbereinigung“ als Beleg für die transformative Kraft Künstlicher Intelligenz (KI) im Datenmanagement. Mithilfe von KI werden präzise Analysen, verbesserte Datenqualität vor der Migration in ein neues System und optimierte Abläufe ermöglicht – allesamt Beiträge zum Erfolg der Organisation in einer datenzentrierten Welt.

Was ist Ihr Use Case?

Möchten Sie wissen, wie Künstliche Intelligenz helfen kann, eine konkrete Problemstellung in Ihrem Unternehmen zu lösen?
Möchten Sie zeitaufwendige Prozesse automatisieren?
Haben Sie Interesse an Prognosen, um Ihre Planung zu vereinfachen?

Sprechen Sie uns an, wir unterstützen Sie gerne!

Zum Management Ihrer Material-Stammdaten in Ihrem ERP-System (SAP S/4HANA oder SAP ECC) haben wir das „Material Master Data Cockpit“ als SAP Add-on für Sie. Bei dem SAP Material Master Data Cockpit handelt es sich um ein leistungsstarkes Tool für die Analyse von Stammdaten, sowohl für ein konkretes Material als auch den gesamten Materialstamm. Dieses benutzerfreundliche SAP-ERP-Add-on stellt Ihnen eine sehr schnelle, detaillierte und aktuelle Übersicht über jegliches Material (oder eine Liste von Materialien) in Ihrem SAP-ERP-System zur Verfügung:

SAP Material Master Data Cockpit

Gerne zeigen wir Ihnen anhand einer Live-System-Demo alle Funktionen unseres SAP Material Master Data Cockpits und beantworten Ihre Fragen.

Mehr Informationen

Schreibe einen Kommentar Antworten abbrechen

Weitere Blog-Artikel zu diesem Thema

von Michaela Hoffmann

Migration zu SAP S/4HANA: Massenupload Statistischer Warennummern

So geht ein initialer Upload statistischer Warennummern mit SAP S/4HANA International Trade

24. März 2022
4 Minuten

von Martina Ksinsik

S/4HANA-Migration per Empty Shell bzw. Shell Conversion

Was verbirgt sich hinter dem Begriff Shell-Conversion und für wen kommt dieser Ansatz in Betracht?

3. Dezember 2021
5 Minuten

von Sara Yad Mellat

PIKONs SAP Material Master Data Cockpit

Das SAP Add-On gibt Ihnen den detaillierten und aktuellen Überblick zu jedem Material in Ihrem SAP ERP-System

25. November 2021
4 Minuten

von Albert Schulz

Webinar: Künstliche Intelligenz im Controlling

Lernen Sie, wie Sie Ihre Absatzplanungen präziser und automatisiert mit KI erstellen können.

27. Mai 2021
1 Minute

von Leon Wolber

Künstliche Intelligenz (KI) im CRM-Migrationsprojekt

Bereinigung der Stammdaten vor der Migration des CRM-Systems mit Hilfe von künstlicher Intelligenz.

12. März 2021
5 Minuten

von Jörg Hofmann

11. Deutscher Maschinenbaugipfel in Berlin

Großes Treffen der Maschinenbaubranche in Berlin: Unser Fazit aus den Vorträgen der beiden Tage.

21. Oktober 2019
4 Minuten

von Albert Schulz

PIKON bei der 11. Montagetagung in Saarbrücken

Zusammen mit ZeMA stellten wir ein gemeinsames Projekt zur KI-gestützten Qualitätsprüfung vor.

16. Mai 2019
3 Minuten

von Maik-Andy Hastenteufel

IOT – Schnittstelle zwischen virtueller und realer Welt

IOT mehr als ein Buzzword! Fragen die sich ein Unternehmen für die Zukunft & Industrie 4.0 stellt.

25. April 2019
5 Minuten

von Albert Schulz

Machine-Learning: So verstehen Sie die Black-Box

Wenn Sie Ihre Modelle verstehen, können Sie auch die Ergebnisse interpretieren und verifizieren.

1. März 2019
5 Minuten

von Benjamin Duppe

Wie Sie mit Data Science smart planen …und die Früchte ernten

So prognostizieren und simulieren Sie Ihren Absatz in Abhängigkeit von diversen Einflussfaktoren.

7. Dezember 2018
7 Minuten

von Jochen Scheibler

Digitalisierung kommt im Unternehmensalltag an

DSAG Kongress 2018: Eindrücke und Trends - Ein Resümee von unserem Vorstand Jochen Scheibler

19. Oktober 2018
6 Minuten

von Benjamin Duppe

Künstliche Intelligenz als Werkzeug nutzen

Wie bringe ich meinen Hammer dazu, Nägel in die Wand zu schlagen?

16. August 2018
8 Minuten