Überblick über das Toolset "Feature- und Tabellenanalyse"

Das Toolset "Feature- und Tabellenanalyse" enthält Werkzeuge zum Anwenden von Algorithmen für maschinelles Lernen und Deep Learning auf Feature- oder Tabellendaten.

Das Werkzeug Mit AutoML trainieren verwendet automatisiertes maschinelles Lernen (AutoML), um Modelle für maschinelles Lernen mit Trainingsdaten und den verfügbaren Rechenressourcen zu trainieren und zu optimieren. Die trainierten Modelle können in Mit AutoML vorhersagen zum Vorhersagen sowohl kategorischer Variablen (Klassifizierung) als auch kontinuierlicher Variablen (Regression) verwendet werden.

Das Training von Modellen für maschinelles Lernen (ML) war bislang ein komplexer Prozess, der spezielles Wissen über verschiedene Modelltypen und die Optimierung ihrer Parameter (sogenannter Hyperparameter) erforderte, um die besten Ergebnisse zu erzielen. Dabei handelt es sich um einen iterativen Prozess, mit dem das genaueste Modell und die geeigneten Hyperparameter anhand von mehreren Experimenten bestimmt werden müssen. Mit den AutoML-Werkzeugen wird dieser Prozess ohne Programmierung automatisiert. Dabei bieten sie Einblicke in die Performance und die Hyperparameter der trainierten Modelle sowie Erkenntnisse dazu, welche Features den größten Einfluss auf die Modellergebnisse haben.

Werkzeuge im Toolset "Feature- und Tabellenanalyse"

WerkzeugBeschreibung

Mit AutoML trainieren

Mit diesem Werkzeug wird ein Deep-Learning-Modell trainiert, indem Training-Pipelines erstellt und ein Großteil des Trainingsprozesses automatisiert wird. Dazu gehören explorative Datenanalyse, Feature-Auswahl, Feature Engineering, Modellauswahl, Hyperparameter-Optimierung und Modelltraining. Die Ausgaben enthalten Performance-Kennwerte des besten Modells in den Trainingsdaten sowie das trainierte Deep-Learning-Modellpaket (.dlpk), das als Eingabe für das Werkzeug Mit AutoML vorhersagen verwendet werden kann, um Vorhersagen für ein neues Dataset zu treffen.

Mit AutoML vorhersagen

Mit diesem Werkzeug werden kontinuierliche Variablen (Regression) oder Kategorievariablen (Klassifizierung) für nicht bekannte kompatible Datasets mithilfe eines trainierten .dlpk-Modells vorhergesagt, das vom Werkzeug Mit AutoML trainieren erstellt wird.