Beschreibung
Die erforderlichen Permutationen der zufälligen Spannbäume zum Berechnen der Wahrscheinlichkeiten für die Cluster-Mitgliedschaft beanspruchen Zeit und Speicher. Diese lassen sich verringern, indem die in der Umgebungseinstellung Faktor für parallele Verarbeitung verwendete Anzahl der Kerne erhöht wird.
Lösung
Der Parameter Permutationen zum Berechnen von Mitgliedschaftswahrscheinlichkeiten verwendet Permutationen und eine Beweisakkumulation, um die Wahrscheinlichkeit der Cluster-Mitgliedschaft für jedes Feature zu berechnen. Bei einer hohen Wahrscheinlichkeit können Sie davon ausgehen, dass das Feature zum zugewiesenen Cluster gehört. Eine niedrige Wahrscheinlichkeit kann darauf hinweisen, dass sich das Feature deutlich von dem zugewiesenen Cluster unterscheidet oder dass das Feature in einen anderen Cluster eingeschlossen werden könnte, wenn die Analysefelder, Cluster-Größenbeschränkungen oder Räumlichen Einschränkungen auf irgendeine Weise geändert würden.
Bei der Berechnung dieser Wahrscheinlichkeiten werden Permutationen zufälliger Spannbäume und eine Beweisakkumulation verwendet. Dadurch kann sich die Ausführungszeit bei größeren Datasets deutlich erhöhen. Es empfiehlt sich, zuerst eine Iteration durchzuführen und die optimale Anzahl Cluster für die Analyse zu ermitteln. Anschließend berechnen Sie die Wahrscheinlichkeiten für die Analyse in einer weiteren Ausführung. Sie können Vorgänge auch auf mehrere Prozesse aufteilen und ausführen, indem Sie die in der Umgebungseinstellung Faktor für parallele Verarbeitung verwendete Anzahl der Kerne erhöhen.