110490: El tamaño de la muestra es menor que el número mínimo de entidades requeridas para la clasificación <value>.

Descripción

El valor especificado del parámetro Datos disponibles por árbol (%) da como resultado menos de dos valores de datos por árbol. Se requieren al menos dos valores de datos por árbol para la clasificación.

Solución

Aumente el valor del parámetro Datos disponibles por árbol (%) para que haya al menos dos valores de datos para cada árbol. Se supone que el diez por ciento de las entidades de entrada (redondeadas) se retienen para la validación. Multiplique el número restante de entidades por el porcentaje de datos por árbol (%) para determinar cuántos valores de datos estarán disponibles para cada árbol.

Por ejemplo, tiene 105 entidades y un 2 por ciento de los datos disponibles por árbol. En este caso, se asume que 11 valores se retienen para la validación (105 * 10/100 = 10.5, que se redondea por exceso a 11), dejando 94 entidades disponibles para el entrenamiento. Cada árbol tendrá solo un valor de datos, que es menor que el mínimo requerido de dos valores por árbol (94 * 2/100 = 1.88, que se redondea por defecto a 1).