• Wählen Sie Ihre Websites

Data Quality Services

 

Ihre geschäftlichen Entscheidungen sind von vertrauenswürdigen Daten abhängig. Ungültige Datenwerte, Inkonsistenzen und doppelte Geschäftsentitäten aber auch einfach nur unterschiedliche Schreibweisen können zu Fehlern in Reporting und Analyse führen. Wir helfen Ihnen bei der Sicherstellung der notwendigen Datenqualität.

 

 

Data Quality Services ist eine Lösung basierend auf:

  • Knowledge Bases
    • Data Steward versteht Daten und weiß ob Werte valide sind oder was typische Fehler sind (z.B. St. Plöten > St. Pölten)
    • Knowledge Discovery bietet Hilfe beim Erkennen der Daten und dadurch beim Erstellend von Regeln
    • Domain validation rules (z.B. Postleitzahl hat 4 Stellen in Österreich und 5 in Deutschland)
    • Domain correction rules(z.B. OÖ = Oberösterreich)
    • Matching rules
  • Knowledge Domains
    • Ist spezifisch für ein Datenfeld (typischerweise Spalten)
    • Enthält Werte und Validierungsregeln (valid, invalid & Error)
    • Definiert Regeln um Werte zu führenden Werten zu korrigieren

 

Data Quality Services kann eingesetzt werden für:

  • Data Cleansing
    • Die Daten werden kategorisiert (neu, ungültig, korrigiert, richtig) und entsprechende Use Cases, also wie mit den Daten umgegangen werden soll, definiert.
  • Data Matching
    • Definieren von „matching rules“ für Geschäftsentitäten in einer „matching policy“ um die möglichen Übereinstimmungen mit einer Wahrscheinlichkeit zu bewerten und gemäß definierter Schwellwerten auszuwerfen
    • Vergleichen von Entitäten mit Domains anhand von Regeln bezüglich Similarity (Ähnliche oder exakte Übereinstimmungen), Weight (Prozentsatz wenn es eine Übereinstimmung gibt) und Prerequisites (obligatorische Übereinstimmungsregel zwischen Domäne und Entität)
  • Wenn die kombinierte Gewichtung von allen Übereinstimmungen einen definierten Schwellenwert übersteigt dann sind die Entitäten Duplikate!