Composantes principales multidimensionnelles (Image Analyst)

Disponible avec une licence Image Analyst.

Synthèse

Transforme les rasters multidimensionnels en leurs composantes principales, chargements et valeurs propres. Cet outil transforme les données en un nombre réduit de composantes qui tiennent compte de la variance des données, afin de faciliter l’identification des modèles spatiaux et temporels.

Utilisation

  • Utilisez des valeurs propres et des pourcentages cumulés de variances dans la table Valeurs propres en sortie afin de déterminer le nombre de composantes nécessaires pour définir les données sans perdre d’informations essentielles.

    Table de valeurs propres

    Dans l’exemple ci-dessus, la première composante présente un pourcentage de variance de 72,51. Pour atteindre une valeur de 95 pour cent de la variance, sélectionnez les cinq premières composantes.

  • L’option Réduction de dimension du paramètre Mode analyse les données en tant qu’ensemble d’images. Elle transforme et réduit les données en un ensemble d’images qui capturent les entités et modèles dominants. Les composantes principales sont un ensemble de rasters stockés sous forme de jeu de données multibande.

  • L’option Réduction spatiale du paramètre Mode analyse les données en tant qu’ensemble de pixels dans la série chronologique. Elle recherche les modèles temporels dominants ainsi que les localisations spatiales associées de ces modèles temporels. Les composantes principales sont un ensemble de tableaux unidimensionnels stockés dans une table.

  • Des diagrammes sont automatiquement créés sur les couches en sortie en vue de l’analyse et de la compréhension des chargements, des composantes principales et des valeurs propres.

  • Le paramètre Nombre de composantes principales indique le nombre de bandes dans la sortie. Pour éviter la sortie d’un raster de trop grande taille, utilisez un pourcentage ou un nombre de composantes approprié. En règle générale, les premières composantes suffisent à couvrir la plus grande partie de la variance dans les données.

Paramètres

ÉtiquetteExplicationType de données
Raster multidimensionnel en entrée

Raster multidimensionnel en entrée.

L’outil traite les données le long d’une dimension, par exemple un raster de série chronologique ou un cube de données défini par une dimension non temporelle [X, Y, Z]. Si une variable en entrée comprend plusieurs dimensions (profondeur et temps, par exemple), la première valeur de dimension est utilisée par défaut.

Vous pouvez utiliser l’outil Générer une couche raster multidimensionnelle ou Sous-ensemble du raster multidimensionnel pour redéfinir les données multidimensionnelles, en les configurant par exemple dans un jeu de données avec une dimension.

Raster Dataset; Mosaic Dataset; Raster Layer; Mosaic Layer; Image Service; File
Mode

Spécifie la méthode à utiliser pour effectuer l’analyse des composantes principales.

  • Réduction des dimensionsLes données de la série chronologique en entrée seront traitées en tant que jeu d’images. Les composantes principales qui extraient des modèles dominants au fil du temps seront calculées. Il s’agit de l’option par défaut.
  • Réduction spatialeLes données de la série chronologique en entrée sont traitées en tant qu’ensemble de pixels. Les composantes principales qui extraient des localisations et des modèles dominants au fil du temps sont calculées sous la forme d’un ensemble de tableaux unidimensionnels stockés dans une table.
String
Dimension

Nom de la dimension servant à traiter les composantes principales.

String
Composantes principales en sortie

Nom du jeu de données raster en sortie.

Lorsque le paramètre Mode est défini sur Réduction de dimension, la sortie est un raster multibande, dont les composantes sont des bandes. La première bande est la première composante principale avec la valeur propre la plus élevée, la deuxième bande possède la composante principale avec la deuxième valeur propre la plus élevée et ainsi de suite. La sortie est au format CRF (fichier .crf), qui conserve les informations multidimensionnelles.

Lorsque le paramètre Mode est défini sur Réduction spatiale, la sortie est une table qui contient un ensemble de données de séries chronologiques représentant les composantes principales.

Raster Dataset; Table
Chargements en sortie

Données des chargements en sortie faisant partie des composantes principales.

Lorsque le paramètre Mode est défini sur Réduction de dimension, la sortie est une table qui contient les pondérations de chaque raster en entrée faisant partie des composantes principales. Ces pondérations définissent les corrélations des données en entrée et des composantes principales en sortie. Utilisez l’extension de fichier .csv pour générer les chargements sous forme de fichier de valeurs séparées par des virgules.

Lorsque le paramètre Mode est défini sur Réduction spatiale, la sortie est un raster dans lequel les valeurs de pixel sont les pondérations des composantes principales. Plus les valeurs des pixels sont élevées, plus la corrélation avec les composantes principales est importante. Cette sortie peut avoir une taille de cellule supérieure à celle du raster en entrée car une reprojection aléatoire est appliquée dans le but de réduire la complexité du calcul.

Données des chargements en sortie faisant partie des composantes principales.

Lorsque le paramètre mode est défini sur DIMENSION_REDUCTION, la sortie est une table qui contient les pondérations de chaque raster en entrée faisant partie des composantes principales. Ces pondérations définissent les corrélations des données en entrée et des composantes principales en sortie. Utilisez l’extension de fichier .csv pour générer les chargements sous forme de fichier de valeurs séparées par des virgules.

Lorsque le paramètre mode est défini sur SPATIAL_REDUCTION, la sortie est un raster dans lequel les valeurs de pixel sont les pondérations des composantes principales. Plus les valeurs des pixels sont élevées, plus la corrélation avec les composantes principales est importante. Cette sortie peut avoir une taille de cellule supérieure à celle du raster en entrée car une reprojection aléatoire est appliquée dans le but de réduire la complexité du calcul.

Table; Raster Dataset
Valeurs propres en sortie
(Facultatif)

Table des valeurs propres en sortie. Les valeurs propres sont des valeurs qui indiquent le pourcentage de variance de chaque composante. Elles vous aident à définir le nombre de composantes principales nécessaires pour représenter le jeu de données.

Table
Variable
(Facultatif)

Variable du raster multidimensionnel en entrée utilisé dans le calcul. Si le raster en entrée est multidimensionnel et qu’aucune variable n’est spécifiée, seule la première variable est analysée par défaut.

Par exemple, pour trouver les années qui ont connu les plus fortes températures, spécifiez la température comme variable à analyser. Si vous ne spécifiez aucune variable et que vous possédez des variables de précipitation et de température, ces deux variables sont analysées et le raster multidimensionnel en sortie inclut alors les deux variables.

String
Nombre de composantes principales
(Facultatif)

Nombre de composantes principales à calculer, généralement inférieur au nombre de rasters en entrée.

Ce paramètre prend également la forme d’un pourcentage (%). Par exemple, 90 % signifie que le nombre de composantes capables d’expliquer 90 % de la variance dans les données est calculé.

String

MultidimensionalPrincipalComponents(in_multidimensional_raster, mode, dimension, out_pc, out_loadings, {out_eigenvalues}, {variable}, {number_of_pc})
NomExplicationType de données
in_multidimensional_raster

Raster multidimensionnel en entrée.

L’outil traite les données le long d’une dimension, par exemple un raster de série chronologique ou un cube de données défini par une dimension non temporelle [X, Y, Z]. Si une variable en entrée comprend plusieurs dimensions (profondeur et temps, par exemple), la première valeur de dimension est utilisée par défaut.

Vous pouvez utiliser l’outil Générer une couche raster multidimensionnelle ou Sous-ensemble du raster multidimensionnel pour redéfinir les données multidimensionnelles, en les configurant par exemple dans un jeu de données avec une dimension.

Raster Dataset; Mosaic Dataset; Raster Layer; Mosaic Layer; Image Service; File
mode

Spécifie la méthode à utiliser pour effectuer l’analyse des composantes principales.

  • DIMENSION_REDUCTIONLes données de la série chronologique en entrée seront traitées en tant que jeu d’images. Les composantes principales qui extraient des modèles dominants au fil du temps seront calculées. Il s’agit de l’option par défaut.
  • SPATIAL_REDUCTIONLes données de la série chronologique en entrée sont traitées en tant qu’ensemble de pixels. Les composantes principales qui extraient des localisations et des modèles dominants au fil du temps sont calculées sous la forme d’un ensemble de tableaux unidimensionnels stockés dans une table.
String
dimension

Nom de la dimension servant à traiter les composantes principales.

String
out_pc

Nom du jeu de données raster en sortie.

Lorsque le paramètre mode est défini sur DIMENSION_REDUCTION, la sortie est un raster multibande, dont les composantes sont des bandes. La première bande est la première composante principale avec la valeur propre la plus élevée, la deuxième bande possède la composante principale avec la deuxième valeur propre la plus élevée et ainsi de suite. La sortie est au format CRF (fichier .crf), qui conserve les informations multidimensionnelles.

Lorsque le paramètre mode est défini sur SPATIAL_REDUCTION, la sortie est une table qui contient un ensemble de données de séries chronologiques représentant les composantes principales.

Raster Dataset; Table
out_loadings

Données des chargements en sortie faisant partie des composantes principales.

Lorsque le paramètre mode est défini sur DIMENSION_REDUCTION, la sortie est une table qui contient les pondérations de chaque raster en entrée faisant partie des composantes principales. Ces pondérations définissent les corrélations des données en entrée et des composantes principales en sortie. Utilisez l’extension de fichier .csv pour générer les chargements sous forme de fichier de valeurs séparées par des virgules.

Lorsque le paramètre mode est défini sur SPATIAL_REDUCTION, la sortie est un raster dans lequel les valeurs de pixel sont les pondérations des composantes principales. Plus les valeurs des pixels sont élevées, plus la corrélation avec les composantes principales est importante. Cette sortie peut avoir une taille de cellule supérieure à celle du raster en entrée car une reprojection aléatoire est appliquée dans le but de réduire la complexité du calcul.

Table; Raster Dataset
out_eigenvalues
(Facultatif)

Table des valeurs propres en sortie. Les valeurs propres sont des valeurs qui indiquent le pourcentage de variance de chaque composante. Elles vous aident à définir le nombre de composantes principales nécessaires pour représenter le jeu de données.

Table
variable
(Facultatif)

Variable du raster multidimensionnel en entrée utilisé dans le calcul. Si le raster en entrée est multidimensionnel et qu’aucune variable n’est spécifiée, seule la première variable est analysée par défaut.

Par exemple, pour trouver les années qui ont connu les plus fortes températures, spécifiez la température comme variable à analyser. Si vous ne spécifiez aucune variable et que vous possédez des variables de précipitation et de température, ces deux variables sont analysées et le raster multidimensionnel en sortie inclut alors les deux variables.

String
number_of_pc
(Facultatif)

Nombre de composantes principales à calculer, généralement inférieur au nombre de rasters en entrée.

Ce paramètre prend également la forme d’un pourcentage (%). Par exemple, 90 % signifie que le nombre de composantes capables d’expliquer 90 % de la variance dans les données est calculé.

String

Exemple de code

Exemple 1 d’utilisation de la fonction MultidimensionalPrincipalComponents (fenêtre Python)

Cet exemple calcule trois composantes principales à partir d’un raster de série chronologique NDVI.

# Import system modules 
import arcpy 
from arcpy.ia import *  

# Check out the ArcGIS Image Analyst extension license 
arcpy.CheckOutExtension("ImageAnalyst") 

arcpy.env.workspace = r"c:\data" 
arcpy.ia.MultidimensionalPrincipalComponents('ndviData.crf', 'DIMENSION_REDUCTION', "StdTime", "ndviData_PC.crf", "ndviData_loadings.csv", "ndviData_eiganvalues.csv", None, 3)
Exemple 2 d’utilisation de la fonction MultidimensionalPrincipalComponents (script autonome)

Cet exemple calcule quatre composantes principales à partir d’un raster de série chronologique NDVI avec un mode Réduction de dimension.

# Import system modules 
import arcpy 
from arcpy.ia import * 

# Check out the ArcGIS Image Analyst extension license 
arcpy.CheckOutExtension("ImageAnalyst") 

# Define input parameters 
inputFile = r"c:\data\ndviData.crf" 
mode = "DIMENSION_REDUCTION" 
dimension = "StdTime" 
out_pc = r"c:\data\ndviData_pc.tif" 
out_loadings = r"c:\data\ndviData_loadings.csv" 
out_eiganvalues = r"c:\data\ndviData_pc.csv" 
variable = "ndvi" 
pc_number = 4 
  
# Execute  

arcpy.ia.MultidimensionalPrincipalComponents(inputFile, mode, dimension, out_pc, out_loadings, out_eiganvalues, variable, pc_number)
Exemple 3 d’utilisation de la fonction MultidimensionalPrincipalComponents (fenêtre Python)

Cet exemple calcule trois composantes principales à partir d’un raster de série chronologique avec un mode Réduction spatiale.

# Import system modules  

import arcpy  
from arcpy.ia import *   

# Check out the ArcGIS Image Analyst extension license  
arcpy.CheckOutExtension("ImageAnalyst")  

arcpy.env.workspace = r"c:\data"  
arcpy.ia.MultidimensionalPrincipalComponents('sstData.crf', 'SPATIAL_REDUCTION', "StdTime", "sstData_temporal_PC.csv", "sstData_loading_raster.crf", "sstData_eiganvalues.csv", None, 3)

Rubriques connexes