Überblick über das Toolset "Data Engineering"

Das Toolset "Data Engineering" enthält Werkzeuge zum Vorbereiten von Feldern für Analyse-Workflows, z. B. Transformieren, Standardisieren, Codieren und Reklassifizieren von Werten. Diese Werkzeuge sind so konzipiert, dass sichergestellt ist, dass Datasets bereinigt, konsistent und für Modellierungs- und Analyse-Workflows bereit sind.

WerkzeugBeschreibung

Feld codieren

Mit diesem Werkzeug werden Kategoriewerte (Zeichenfolgen, ganze Zahlen oder Datumsangaben) im mehrere numerische Felder konvertiert, die jeweils eine Kategorie darstellen. Die codierten numerischen Felder können in den meisten Data Science-Workflows und statistischen Workflow wie etwa in Regressionsmodellen verwendet werden.

Feldstatistik in Tabelle

Erstellt eine Tabelle beschreibender Statistiken für Eingabefelder in einer Tabelle oder Feature-Class.

Feld reklassifizieren

Reklassifiziert Werte in einem numerischen Feld oder Textfeld auf der Basis von Grenzen, die manuell oder mithilfe einer Reklassifizierungsmethode definiert wurden.

Feld standardisieren

Standardisiert Werte in Feldern, indem sie in Werte konvertiert werden, die einem bestimmten Maßstab folgen. Zu dem Standardisierungsmethoden gehören "Z-Wert", "Minimum-Maximum", "Absolutes Maximum" und "Robuste Standardisierung".

Feld transformieren

Transformiert kontinuierliche Werte in einem oder mehreren Feldern, indem auf die einzelnen Werte mathematische Funktionen angewendet werden und die Form der Verteilung geändert wird. Zu den Transformationsmethoden dieses Werkzeugs gehören "Logarithmisch", "Quadratwurzel", "Box-Cox", "Kehrwert", "Quadrat", "Exponentiell" und "Box-Cox invers".

Werkzeuge im Toolset "Data Engineering"

Verwandte Themen