Как работает Многомерный анализ главных компонент

Доступно с лицензией Image Analyst.

Анализ по методу главных компонент (PCA) - классический механизм исследовательского анализа данных. Он часто используется для уменьшения размерности набора данных с целью идентификации функций и структуры данных. Например, в многомерном анализе PCA можно использовать для определения того, какие переменные необходимы, а какие можно исключить, не повлияв на результат анализа. При анализе мультиспектральных и гиперспектральных изображений инструмент Многомерные главные компоненты можно использовать для вычисления набора главных компонент, которые будут содержать большую часть информации и позволят выполнять анализ на меньшем количестве каналов. Данные временных рядов изображений стали более распространенными, но создают проблемы для идентификации и извлечения целевой информации. Этот инструмент использует технику PCA для анализа данных временных серий и многомерных растров.

Анализ по методу главных компонент для набора многомерных растровых данных

Многомерный анализ содержит одну или несколько переменных. Инструмент Многомерные главные компоненты анализирует одну переменную за раз, куб данных 3D-изображения либо с (x,y,time) либо (x,y,z), и преобразует куб данных изображения в набор главных компонентов, в котором дисперсия максимальна, поэтому объекты и структура данных могут быть идентифицированы и извлечены. Куб данных изображения можно рассматривать двумя способами: набор изображений (срезов), каждое из которых представляет собой изображение в момент времени, или набор одномерных массивов, каждый из которых представляет собой временной ряд пикселей (временной профиль). В следующем примере данные временных рядов изображений используются для описания функциональности с учетом того, что инструмент может применяться к данным с невременным измерением:

Набор изображений
Режим уменьшения измерений анализирует набор изображений.

Набор пикселов временных рядов
Режимы пространственного уменьшения анализирует пикселы временных рядов.

Вы можете применить анализ главных компонент, используя режим уменьшения количества измерений и режим пространственного уменьшения. Обработка в этих двух режимах требует двух разных приложений.

  • Режим уменьшения измерений анализирует данные, как набор изображений. Он преобразует и сокращает данные в набор изображений, который демонстрирует доминирующие закономерности и объекты. Например, вы можете извлечь пикселы воды, преобладающие во временном ряду изображений, и отобразить изменения водоема с течением времени. Режим уменьшения измерений часто используется при анализе наземных данных временных рядов изображений, например, временных рядов NDVI.
  • Режим пространственного уменьшения анализирует данные как набор пикселов временных рядов. Он идентифицирует основные временные закономерности и соответствующие пространственные местоположения этих временных закономерностей. Например, вы можете извлечь межгодовую временную диаграмму явлений Эль-Ниньо и Ла-Нинья, используя данные о температуре поверхности моря и их местоположения. Это подходит для анализа длинных временных рядов, но не для данных высокого разрешения.

Пример инструмента Многомерные главные компоненты

В приведенном ниже примере временной ряд изображений содержит k изображений X1, X2, …, Xk, а вычисленная главная компонента представляет собой линейную комбинацию изображений, выраженную следующим образом:

PC1 = a11X1 + a12X2 + … + a1kXk

Ее матричная форма для всех главных компонент - следующая:

Y = XA

где:

Y = (PC1, PC2, …, PCk)
это матрица, содержащая главные компоненты, а
X = (X1, X2, …, Xk)
это матрица, содержащая входные данные.

Матрица А содержит коэффициенты трансформации исходных данных в главные компоненты. Значения матрицы A называются нагрузками, которые описывают, какой вклад каждое изображение вносит в определенную главную компоненту. Большая нагрузка указывает на то, что у изображения есть сильная связь с определенной главной компонентой. Знак нагрузки указывает на то, положительно или отрицательно коррелируют изображение и его главная компонента.

Нормализованные столбцы в матрице A являются собственными векторами, которые определяют ориентацию главных компонент относительно исходных изображений. Собственные значения, вычисленные вместе с собственными векторами, указывают дисперсии, объясняемые каждой главной компонентой. Собственные значения, упорядоченные от наибольшего к наименьшему, задают последовательность главных компонент.

Первая компонента рассчитывается таким образом, чтобы она брала максимально возможную дисперсию данных, вторая компонента - следующую по величине дисперсию, при условии, что она не коррелирует с первой компонентой (перпендикулярна ей) первой компоненте и т.д. Процесс будет продолжаться до тех пор, пока не будет подсчитано общее количество указанных компонент. Вся информация, содержащаяся в исходных данных, сохранится, если вы вычислите все главные компоненты.

См. раздел Введение в анализ методом главных компонент (PCA) для получения подробной информации.

Подробную информацию см. в разделе Многомерные главные компоненты.

Связанные разделы