Das Toolset "Data Engineering" enthält Werkzeuge zum Vorbereiten von Feldern für Analyse-Workflows, z. B. Transformieren, Standardisieren, Codieren und Reklassifizieren von Werten. Diese Werkzeuge sind so konzipiert, dass sichergestellt ist, dass Datasets bereinigt, konsistent und für Modellierungs- und Analyse-Workflows bereit sind.
Werkzeug | Beschreibung |
---|---|
Mit diesem Werkzeug werden Kategoriewerte (Zeichenfolgen, ganze Zahlen oder Datumsangaben) im mehrere numerische Felder konvertiert, die jeweils eine Kategorie darstellen. Die codierten numerischen Felder können in den meisten Data Science-Workflows und statistischen Workflow wie etwa in Regressionsmodellen verwendet werden. | |
Erstellt eine Tabelle beschreibender Statistiken für Eingabefelder in einer Tabelle oder Feature-Class. | |
Reklassifiziert Werte in einem numerischen Feld oder Textfeld auf der Basis von Grenzen, die manuell oder mithilfe einer Reklassifizierungsmethode definiert wurden. | |
Standardisiert Werte in Feldern, indem sie in Werte konvertiert werden, die einem bestimmten Maßstab folgen. Zu dem Standardisierungsmethoden gehören "Z-Wert", "Minimum-Maximum", "Absolutes Maximum" und "Robuste Standardisierung". | |
Transformiert kontinuierliche Werte in einem oder mehreren Feldern, indem auf die einzelnen Werte mathematische Funktionen angewendet werden und die Form der Verteilung geändert wird. Zu den Transformationsmethoden dieses Werkzeugs gehören "Logarithmisch", "Quadratwurzel", "Box-Cox", "Kehrwert", "Quadrat", "Exponentiell" und "Box-Cox invers". |