Вычислить составной индекс (Пространственная статистика)

Краткая информация

Комбинирует несколько числовых переменных для создания единого индекса.

Составные индексы используются в социальной и экологической сферах для представления сложной информации из нескольких показателей в виде единой метрики, которая может измерить прогресс в достижении цели и облегчить принятие решений. Инструмент поддерживает три основных этапа процесса создания индекса: стандартизация входных переменных до общей шкалы (предварительная обработка), объединение переменных в одну переменную индекса (комбинирование), а также пересчет и классификация полученного индекса до значимых значений (постобработка).

Подробнее о том, как работает инструмент Вычислить составной индекс

Иллюстрация

Иллюстрация инструмента Вычислить составной индекс

Использование

  • На создание подходящего индекса влияет тщательное рассмотрение вопроса, на который пытается ответить индекс, выбора переменных и применяемых методов. Это должно быть сделано после консультаций с экспертами в соответствующей области и конечными пользователями.

    Подробнее о рекомендациях по созданию составных индексов

  • Используйте параметр Входные переменные для обозначения числовых полей, которые будут использоваться в индексе. Инструмент пропускает записи с отсутствующими значениями в любой входной переменной.

  • Вы можете использовать параметр Предустановленный метод пересчета и объединения переменных, чтобы указать метод создания индекса. Например, опция Объединить значения (среднее значение пересчитанных значений) пересчитывает входные переменные в значения в диапазоне от 0 до 1 и использует среднее значение входных переменных с новой шкалой в качестве индекса.

    • Параметр Предустановленный метод пересчета и объединения переменных изменит значения параметров Метод пересчета входных переменных и Метод объединения пересчитанных переменных. Для дальнейшей настройки выберите опцию Пользовательский, чтобы задать значения вручную.

  • Параметр Метод пересчета входных переменных применит выбранный метод ко всем входным переменным.

    • Опция Минимум-максимум – самая простая, поскольку она сохраняет распределение входных переменных и пересчитывает их по шкале от 0 до 1, которую легко интерпретировать.
    • При работе с переменным, имеющими асимметричное распределение или выбросы, используйте метод Процентиль или Ранг, который ранжирует данных, или используйте опцию Флаг по пороговому значению (бинарный), для преобразования переменных в двоичные (0 или 1) значения.
    • Чтобы создать индекс, который будет перестраиваться по мере поступления новых данных — например, годовой индекс производительности — используйте опцию Минимум-максимум (пользовательские диапазоны данных) или Z-оценка (пользовательская). Используя любой из этих вариантов, вы сможете задать устойчивые эталонные метки, которые позволят сравнивать данные с различными диапазонами и распределениями.
    • Опция Необработанные значения полезна, когда переменные находятся в сопоставимой шкале, например, при использовании процентных долей или если переменные были предварительно обработаны с помощью других инструментов.

  • Используйте инструменты Трансформировать поле, Стандартизировать поле или Переклассифицировать поле, если необходимо применить методы предварительной обработки, недоступные в инструменте, или если для каждой входной переменной требуются разные методы предварительной обработки.

    • При выполнении предварительной обработки убедитесь, что входные переменные находятся в сопоставимой шкале.
    • Используйте опцию Необработанные значения параметра Метод пересчета входных переменных при выполнении предварительной обработки.

  • Если все входные переменные имеют общую шкалу измерения, например, проценты, используйте опцию Необработанные значения параметра Метод пересчета входных переменных.

  • Опцию Флаг по пороговому значению (бинарный) параметра Метод пересчета входных переменных можно использовать для преобразования входных переменных в значения 0 и 1 на основе пороговых значений. Используйте параметр Метод пересчета для пороговых значений, чтобы по выбору применить шаг предварительной обработки ко всем переменным перед установкой порогового значения. Например, на следующих этапах подсчитывается количество входных переменных, которые выше девяностого процентиля для каждого местоположения:

    1. Установите для параметра Метод пересчета входных переменных значение Флаг по пороговому значению (бинарный).
    2. Установите для параметра Метод пересчета для пороговых значений значение Процентиль.
    3. Установите для параметра Пороговые значение значение Больше чем 0,9 для каждой переменной.
    4. Установите для параметра Метод объединения пересчитанных переменных значение Сумма.

  • Параметр Метод объединения пересчитанных переменных включает аддитивные методы (сумма и среднее) и мультипликативные методы (умножение и геометрическое среднее).

    • Аддитивные методы позволяют переменной с высоким значением компенсировать переменные с низким значением.
    • Мультипликативные методы не позволяют компенсировать низкие значения высокими значениями. Высокие значения индекса возникают только при наличии высоких значений по нескольким переменным.

  • Можно использовать параметр Веса (в категории параметра Веса переменных) для обозначения относительной важности каждой входной переменной. По умолчанию все веса установлены на 1, что означает, что каждая переменная имеет одинаковый вес.

    • Если вы знаете, что одна переменная должна быть вдвое важнее другой переменной, установите для нее вес 2, а для другой переменной вес 1.
    • Вы также можете установить веса, которые в сумме дают 1; например, если используются три переменные и одна из них считается в два раза важнее, чем две другие, вы можете использовать значения весов 0,5, 0,25 и 0,25.

  • Веса оказывают значительное влияние на итоговый индекс. Установление относительной важности переменных является субъективной частью анализа и должно быть обусловлено знанием области и документальным обоснованием.

  • Инструмент создаст поле индекса, поле ранга и поле процентиля. Так же будет создано поле для хранения необработанных индексов при обращении и масштабировании до нового минимума и максимума. Дополнительные поля будут добавлены для каждого из вариантов классификации, указанных в параметре Дополнительные классифицированные выходные данные. Если входные данные представляют собой класс пространственных объектов, и класс пространственных объектов указан в параметре Выходные объекты или таблица, инструмент предоставит составной слой, отображающий слой для поля индекса, поля процентиля и каждого из выбранных вариантов классификации.

  • Слой выходного индекса будет включать графики для просмотра распределения индекса, поможет определить, достигли ли шаги предварительной обработки желаемого результата, и проверить корреляции между входными переменными и индексом.

  • Концепция, которую измеряет индекс, может быть представлена несколькими измерениями. Например, индекс уязвимости может состоять из областей жилья, транспорта и доходов, каждая из которых включает в себя несколько переменных. Рассмотрите возможность создания субиндексов для представления каждого измерения. Это достигается путем многократного запуска инструмента, по одному разу для каждого измерения, и использования результатов в качестве входных переменных для итогового индекса.

  • При построении индекса, включающего субиндексы, используйте ModelBuilder или блокнот в AllSource для потокового процесса. Если используется ModelBuilder, создаются новые объекты для каждого субиндекса, если не отмечен параметр Присоединить поля к входной таблице. Будут созданы отдельные выходные данные для каждого субиндекса, которые должны быть соединены вместе перед формированием результирующего индекса. Этот инструмент не будет соединять нескольких индексов вместе в ModelBuilder, если отмечен параметр Присоединить поля к входной таблице.

  • Рекомендуется сократить количество входных переменных при сохранении, однако, достаточного количества, чтобы захватить основную информацию, необходимую для индекса. Большое количество входных переменных может привести к трудностям при интерпретации индекса. Кроме того, если несколько переменных относятся к одной и той же области, например, медианный доход и бедность, влияние этой области может быть чрезмерно представлено в индексе.

  • Инструмент не поддерживает сохранение выходных объектов в многопользовательской базе геоданных на основе баз данных Microsoft SQL Server, Oracle или SQLite , или мобильных баз геоданных. Если отмечен параметр Присоединить поля к входной таблице, входная таблица не должна быть расположена в многопользовательских базах геоданных на основе баз данных Microsoft SQL Server, Oracle, SQLite или файлов GeoPackage.

Параметры

ПодписьОписаниеТип данных
Входная таблица

Таблица или объекты, содержащие переменные, которые будут объединены в индекс.

Table View
Входные переменные

Список числовых полей, представляющих переменные, которые будут объединены в индекс. Включите опцию Обратить направление, чтобы обратить значения переменных. Это означает, что объект или запись, которая изначально имела наибольшее значение, будет иметь наименьшее значение, и наоборот.

Value Table
Присоединить поля к Входной таблице
(Дополнительный)

Определяет, будут ли результаты присоединяться к входным данным, или предоставляться как выходной класс объектов или таблица.

  • Отмечено — результаты будут присоединены к входным данным. Эта опция изменяет входные данные.
  • Не отмечено — будет создан выходной класс объектов или таблица с результатами. Это значение по умолчанию

Boolean
Выходные объекты или таблица
(Дополнительный)

Выходные объекты или таблица с результатами.

Table; Feature Class
Предустановленный метод пересчета и объединения переменных
(Дополнительный)

Определяет рабочий процесс, который будет использоваться при создании индекса. Опции представляют собой общие рабочие процессы создания индексов; каждая опция устанавливает значения по умолчанию для параметров Метод пересчета входных переменных и Метод объединения пересчета переменных.

  • Объединить значения (среднее значение пересчитанных значений)Индекс будет создан путем пересчета входных переменных в значения в диапазоне от 0 до 1 и усреднения пересчитанных значений. Этот метод подходит для создания индекса, который легко интерпретировать. Форма распределения и выбросы во входных переменных будут влиять на индекс. Это значение по умолчанию
  • Объединить ранги (среднее значение процентилей)Индекс будет создан путем пересчета рангов входных переменных в диапазоне от 0 до 1 и усреднения пересчитанных рангов. Эта опция полезна, когда ранжирование значений переменной более важно, чем различия между значениями. Форма распределения и выбросы во входных переменных не будут влиять на индекс.
  • Соединить разницы (среднее геометрическое пересчитанных значений)Индекс будет создан путем пересчета входных переменных в значения в диапазоне от 0 до 1 и вычисления геометрического среднего для пересчитанных значений. Высокие значения не будут полностью компенсировать низкие значения, поэтому эта опция полезна для создания индекса, в котором более высокие значения индекса будут возникать только при наличии высоких значений по нескольким переменным.
  • Выделить крайние точки (Число значений выше девяностого процентиля)Будет создан индекс, который подсчитывает количество входных переменных со значениями, которые выше или равны девяностому процентилю. Этот метод подходит для выявления местоположений, которые могут считаться наиболее экстремальными или наиболее нуждающимися.
  • ПользовательскиеИндекс будет создан с использованием настроенных опций пересчета и объединения переменных.
String
Метод пересчета входных переменных
(Дополнительный)

Определяет метод, который будет использоваться для преобразования входных переменных в общую шкалу.

  • Минимум – максимумПеременные будут пересчитаны в значения в диапазоне от 0 до 1 с помощью минимального и максимального значений каждой переменной. Это значение по умолчанию
  • Минимум – максимум (пользовательские диапазоны данных)Переменные будут пересчитаны в значения в диапазоне от 0 до 1 с помощью возможного минимального и возможного максимального значений каждой переменной, заданных параметром Пользовательские диапазоны данных. Этот метод имеет множество применений, включая определение минимума и максимума на основе эталонной метки, справочной статистики или теоретических значений. Например, если озоновые дыры за один день находятся в диапазоне от 5 до 27 частей на миллион (ppm), вы можете использовать теоретический минимум и максимум, основанные на предыдущих наблюдениях и знаниях в данной области, чтобы задать возможные значения для максимума и минимума. Это обеспечит возможность сравнения индекса в течение нескольких дней.
  • ПроцентильПеременные будут преобразованы в процентили от 0 до 1 путем ранжирования значения данных. Эта опция полезна, когда необходимо игнорировать абсолютные различия между значениями данных, например, в случае выбросов или асимметричных распределений.
  • РангЗначения будут ранжированы. Наименьшему значению присваивается ранговое значение 1, следующему значению присваивается ранговое значение 2, и т. д. Совпадениям присваивается среднее значение их рангов.
  • Z-оценкаКаждая переменная будет стандартизирована путем вычитания среднего значения и деления на среднеквадратическое отклонение (называемое z-оценка). Z-оценка — это количество среднеквадратических отклонений выше или ниже среднего значения. Эта опция полезна, когда средние значения переменных являются важными точками сравнения. Значения выше среднего получают положительные z-оценки, а значения ниже среднего — отрицательные z-оценки.
  • Z-оценка (пользовательская)Каждая переменная будет стандартизирована путем вычитания пользовательского среднего значения и деления на пользовательское среднеквадратическое отклонение. Укажите пользовательские значения в параметре Пользовательская нормализация. Эта опция полезна, когда средние значения и среднеквадратические отклонения переменных известны из предыдущих исследований.
  • Флаг по пороговому значению (бинарный)Переменные будут идентифицированы, когда они будут выше или ниже определенного порогового значения. Итоговое поле содержит бинарные (0 или 1) значения, указывающие, было ли превышено пороговое значение. Также можно использовать параметр Метод пересчета для пороговых значений для пересчета значений входных переменных перед определением порогового значения, а также использовать параметр Пороговые значения для определения пороговых значений. Этот метод подходит, когда значения переменных менее важны, чем то, превышают ли они определенное пороговое значение, например, предельно допустимую концентрацию загрязняющего вещества.
  • Необработанные значенияБудут использованы исходные значения переменных. Используйте этот метод только в том случае, если все переменные измеряются в сопоставимой шкале, например, в процентах или ставках, или если переменные были стандартизированы до использования этого инструмента.
String
Метод пересчета для пороговых значений
(Дополнительный)

Определяет метод, который будет использоваться для преобразования входных переменных в общую шкалу перед установлением пороговых значений.

  • Минимум – максимумПеременные между 0 и 1 будут пересчитаны с помощью минимального и максимального значений каждой переменной.
  • Минимум – максимум (пользовательские диапазоны данных)Переменные между 0 и 1 будут пересчитаны с помощью возможного минимального и возможного максимального значений каждой переменной.
  • ПроцентильПеременные будут преобразованы в процентили от 0 до 1.
  • Z-оценкаКаждая переменная будет стандартизирована путем вычитания среднего значения и деления на среднеквадратическое отклонение.
  • Z-оценка (пользовательская)Каждая переменная будет стандартизирована путем вычитания пользовательского среднего значения и деления на пользовательское среднеквадратическое отклонение.
  • Необработанные значенияЗначения переменной будут использоваться без изменений. Это значение по умолчанию
String
Пользовательская нормализация
(Дополнительный)

Пользовательское среднее значение и пользовательское среднеквадратическое отклонение, которые будут использоваться при стандартизации каждой входной переменной. Для каждой переменной укажите пользовательское среднее значение в столбце Среднее и пользовательское среднеквадратическое отклонение в столбце Среднеквадратическое отклонение.

Value Table
Пользовательские диапазоны данных
(Дополнительный)

Возможные минимальные и максимальные значения, которые будут использоваться в единицах измерения переменных. Каждая переменная будет пересчитана между 0 и 1 на основе возможных значений минимума и максимума.

Value Table
Пороговые значения
(Дополнительный)

Пороговое значение, определяющее, будет ли пространственный объект отмечен флагом. Укажите значение в единицах пересчитанных переменных и укажите, будут ли отмечены флагом значения выше или ниже порогового значения.

Value Table
Метод объединения пересчитанных переменных
(Дополнительный)

Указывает метод, который будет использоваться для объединения пересчитанных переменных в одно значение.

Вы не можете умножать или вычислять среднее геометрическое, если какие-либо переменные пересчитываются с помощью z-оценок, потому что z-оценки всегда содержат отрицательные значения.

  • СуммаЗначения будут сложены.
  • СреднееБудет рассчитано среднее арифметическое (аддитивное) значение величин. Это значение по умолчанию
  • УмножитьЗначения будут умножены. Все пересчитанные значения должны быть больше или равны нулю.
  • Геометрическое среднееБудет вычислено среднее геометрическое (мультипликативное) значение этих величин. Все пересчитанные значения должны быть больше или равны нулю.
String
Веса
(Дополнительный)

Веса, которые будут задавать относительное влияние каждой входной переменной на индекс. Каждый вес по умолчанию имеет значение 1, что означает, что все переменные имеют равный вклад. Увеличивайте или уменьшайте веса, чтобы отразить относительную важность переменных. Например, если одна переменная вдвое важнее другой, используйте значение веса 2. Использование значений весов больше единицы при умножении для объединения пересчитанных значений может дать индексы с очень большими значениями.

Value Table
Выходное имя индекса
(Дополнительный)

Название индекса. Значение используется в визуализации выходных данных, таких как псевдонимы полей и надписи диаграмм. Значение не используется, если выходной (или добавленный входной) файл является шейп-файлом.

String
Обратить выходные значения индекса
(Дополнительный)

Определяет, будет ли обращено направление выходных значений индекса (например, чтобы высокие значения индекса рассматривались как низкие).

  • Отмечено — направление значений индекса будет обращено.
  • Не отмечено — направление значений индекса не будет обращено. Это значение по умолчанию

Boolean
Минимальное и максимальное выходные значения индекса
(Дополнительный)

Минимум и максимум выходных значений индекса. Этот пересчет применяется после объединения пересчитанных переменных. Если значения не указаны, выходной индекс не пересчитывается.

Value Table
Дополнительные классифицированные выходные данные
(Дополнительный)

Задает метод, который будет использоваться для классификации выходного индекса. Для каждого выбранного варианта будет предоставлено дополнительное выходное поле.

  • Равный интервалБудут созданы классы путем разделения диапазона значений на одинаковые по размеру интервалы.
  • КвантильБудут созданы классы, в каждом из которых содержится одно и то же количество записей.
  • Среднеквадратическое отклонениеКаждая переменная будет стандартизирована путем вычитания среднего значения и деления на среднеквадратическое отклонение (называемое z-оценка). Полученные значения будут находиться в диапазоне от -3 до 3.
  • ПользовательскиеРазбиение на классы и значения с классами будут заданы с помощью параметра Выходные классы пользовательских индексов.
String
Количество классов выходного индекса
(Дополнительный)

Количество классов, которые будут использоваться для методов равных интервалов и классификации квантилей.

Long
Пользовательские классы выходного индекса
(Дополнительный)

Верхние границы и классифицированные значения для пользовательского метода классификации. Например, вы можете использовать эту переменную для классификации индекса, содержащего значения от 0 до 100, на классы, представляющие низкие, средние и высокие значения, на основе пользовательских значений перерыва.

Value Table

Производные выходные данные

ПодписьОписаниеТип данных
Обновленная входная таблица

Обновленная входная таблица.

Feature Layer; Table View
Выходной составной слой

Если входные данные представляют собой класс пространственных объектов, и класс пространственных объектов указан в параметре Выходные объекты или таблица, предоставляется составной слой, отображающий слой для поля индекса, поля процентиля и каждого из выбранных вариантов классификации.

Group Layer

arcpy.stats.CalculateCompositeIndex(in_table, in_variables, {append_to_input}, {out_table}, {index_preset}, {preprocessing}, {pre_threshold_scaling}, {pre_custom_zscore}, {pre_min_max}, {pre_thresholds}, {index_method}, {index_weights}, {out_index_name}, {out_index_reverse}, {post_min_max}, {post_reclass}, {post_num_classes}, {post_custom_classes})
ИмяОписаниеТип данных
in_table

Таблица или объекты, содержащие переменные, которые будут объединены в индекс.

Table View
in_variables
[[var1, reverse1],[var2, reverse2],...]

Список числовых полей, представляющих переменные, которые будут объединены в индекс. Столбец Обратить направление обращает значения переменных. Это означает, что объект или запись, которая изначально имела наибольшее значение, будет иметь наименьшее значение, и наоборот. Значения будут обращены после пересчета.

Value Table
append_to_input
(Дополнительный)

Определяет, будут ли результаты присоединяться к входным данным, или предоставляться как выходной класс объектов или таблица.

  • APPEND_TO_INPUTРезультаты будут присоединены к входным данным. Эта опция изменяет входные данные.
  • NEW_FEATURESБудет создан выходной класс объектов или таблица с результатами. Это значение по умолчанию
Boolean
out_table
(Дополнительный)

Выходные объекты или таблица с результатами.

Table; Feature Class
index_preset
(Дополнительный)

Определяет рабочий процесс, который будет использоваться при создании индекса. Опции представляют собой общие рабочие процессы создания индексов; каждая опция устанавливает значения по умолчанию для параметров preprocessing и index_method.

  • MEAN_SCALEDИндекс будет создан путем пересчета входных переменных в значения в диапазоне от 0 до 1 и усреднения пересчитанных значений. Этот метод подходит для создания индекса, который легко интерпретировать. Форма распределения и выбросы во входных переменных будут влиять на индекс. Это значение по умолчанию
  • MEAN_PCTLИндекс будет создан путем пересчета рангов входных переменных в диапазоне от 0 до 1 и усреднения пересчитанных рангов. Эта опция полезна, когда ранжирование значений переменной более важно, чем различия между значениями. Форма распределения и выбросы во входных переменных не будут влиять на индекс.
  • GEOMEAN_SCALEDИндекс будет создан путем пересчета входных переменных в значения в диапазоне от 0 до 1 и вычисления геометрического среднего для пересчитанных значений. Высокие значения не отменяют низкие значения, поэтому эта опция полезна для создания индекса, в котором более высокие значения индекса будут возникать только при наличии высоких значений по нескольким переменным.
  • SUM_FLAGSPCTLБудет создан индекс, который подсчитывает количество входных переменных со значениями, которые выше или равны девяностому процентилю. Этот метод подходит для выявления местоположений, которые могут считаться наиболее экстремальными или наиболее нуждающимися.
  • CUSTOMИндекс будет создан с использованием настроенных опций пересчета и объединения переменных.
String
preprocessing
(Дополнительный)

Определяет метод, который будет использоваться для преобразования входных переменных в общую шкалу.

  • MINMAXПеременные будут пересчитаны в значения в диапазоне от 0 до 1 с помощью минимального и максимального значений каждой переменной. Это значение по умолчанию
  • CUST_MINMAXПеременные будут пересчитаны в значения в диапазоне от 0 до 1 с помощью возможного минимального и возможного максимального значений каждой переменной, заданных параметром pre_min_max. Этот метод имеет множество применений, включая определение минимума и максимума на основе эталонной метки, справочной статистики или теоретических значений. Например, если озоновые дыры за один день находятся в диапазоне от 5 до 27 частей на миллион (ppm), вы можете использовать теоретический минимум и максимум, основанные на предыдущих наблюдениях и знаниях в данной области, чтобы обеспечить возможность сравнения индекса в течение нескольких дней.
  • PERCENTILEПеременные будут преобразованы в процентили от 0 до 1 путем вычисления процента значений данных, меньших, чем значение данных. Эта опция полезна, когда необходимо игнорировать абсолютные различия между значениями данных, например, в случае выбросов или асимметричных распределений.
  • RANKЗначения будут ранжированы. Наименьшему значению присваивается ранговое значение 1, следующему значению присваивается ранговое значение 2, и т. д. Совпадениям присваивается среднее значение их рангов.
  • ZSCOREКаждая переменная будет стандартизирована путем вычитания среднего значения и деления на среднеквадратическое отклонение (называемое z-оценка). Z-оценка — это количество среднеквадратических отклонений выше или ниже среднего значения. Эта опция полезна, когда средние значения переменных являются важными точками сравнения. Значения выше среднего получают положительные z-оценки, а значения ниже среднего — отрицательные z-оценки.
  • CUST_ZSCOREКаждая переменная будет стандартизирована путем вычитания пользовательского среднего значения и деления на пользовательское среднеквадратическое отклонение. Укажите пользовательские значения в параметре pre_custom_zscore. Эта опция полезна, когда средние значения и среднеквадратические отклонения переменных известны из предыдущих исследований.
  • BINARYПеременные будут идентифицированы, когда они будут выше или ниже определенного порогового значения. Итоговое поле содержит бинарные (0 или 1) значения, указывающие, было ли превышено пороговое значение. Также можно использовать параметр pre_threshold_scaling для пересчета значений входных переменных перед определением порогового значения, а также использовать параметр pre_thresholds для определения пороговых значений. Этот метод подходит, когда значения переменных менее важны, чем то, превышают ли они определенное пороговое значение, например, предельно допустимую концентрацию загрязняющего вещества.
  • RAWБудут использованы исходные значения переменных. Используйте этот метод только в том случае, если все переменные измеряются в сопоставимой шкале, например, в процентах или ставках, или если переменные были стандартизированы до использования этого инструмента.
String
pre_threshold_scaling
(Дополнительный)

Определяет метод, который будет использоваться для преобразования входных переменных в общую шкалу перед установлением пороговых значений.

  • THRESHOLD_MINMAXПеременные между 0 и 1 будут пересчитаны с помощью минимального и максимального значений каждой переменной.
  • THRESHOLD_CUST_MINMAXПеременные между 0 и 1 будут пересчитаны с помощью возможного минимального и возможного максимального значений каждой переменной.
  • THRESHOLD_PERCENTILEПеременные будут преобразованы в процентили от 0 до 1.
  • THRESHOLD_ZSCOREКаждая переменная будет стандартизирована путем вычитания среднего значения и деления на среднеквадратическое отклонение.
  • THRESHOLD_CUST_ZSCOREКаждая переменная будет стандартизирована путем вычитания пользовательского среднего значения и деления на пользовательское среднеквадратическое отклонение.
  • THRESHOLD_RAWЗначения переменной будут использоваться без изменений. Это значение по умолчанию
String
pre_custom_zscore
[[field1, mean1, stdev1], [field2, mean2, stdev2],...]
(Дополнительный)

Пользовательское среднее значение и пользовательское среднеквадратическое отклонение, которые будут использоваться при стандартизации каждой входной переменной. Для каждой переменной укажите пользовательское среднее значение в столбце Среднее и пользовательское среднеквадратическое отклонение в столбце Среднеквадратическое отклонение.

Value Table
pre_min_max
[[field1, min1, max1], [field2, min2, max2],...]
(Дополнительный)

Возможные минимальные и максимальные значения, которые будут использоваться в единицах измерения переменных. Каждая переменная будет пересчитана между 0 и 1 на основе возможных значений минимума и максимума.

Value Table
pre_thresholds
[[field1, method1, threshold1], [field2, method2, threshold2],...]
(Дополнительный)

Пороговое значение, определяющее, будет ли пространственный объект отмечен флагом. Укажите значение в единицах пересчитанных переменных и укажите, будут ли отмечены флагом значения выше или ниже порогового значения.

Value Table
index_method
(Дополнительный)

Указывает метод, который будет использоваться для объединения пересчитанных переменных в одно значение.

  • SUMЗначения будут сложены.
  • MEANБудет рассчитано среднее арифметическое (аддитивное) значение величин. Это значение по умолчанию
  • PRODUCTЗначения будут умножены. Все пересчитанные значения должны быть больше или равны нулю.
  • GEOMETRIC_MEANБудет вычислено среднее геометрическое (мультипликативное) значение этих величин. Все пересчитанные значения должны быть больше или равны нулю.

Вы не можете умножать или вычислять среднее геометрическое, если какие-либо переменные пересчитываются с помощью z-оценок, потому что z-оценки всегда содержат отрицательные значения.

String
index_weights
[[field1, weight1], [field2, weight2],...]
(Дополнительный)

Веса, которые будут задавать относительное влияние каждой входной переменной на индекс. Каждый вес по умолчанию имеет значение 1, что означает, что все переменные имеют равный вклад. Увеличивайте или уменьшайте веса, чтобы отразить относительную важность переменных. Например, если одна переменная вдвое важнее другой, используйте значение веса 2. Использование значений весов больше единицы при умножении для объединения пересчитанных значений может дать индексы с очень большими значениями.

Value Table
out_index_name
(Дополнительный)

Название индекса. Значение используется в визуализации выходных данных, таких как псевдонимы полей и надписи диаграмм. Значение не используется, если выходной (или добавленный входной) файл является шейп-файлом.

String
out_index_reverse
(Дополнительный)

Определяет, будет ли обращено направление выходных значений индекса (например, чтобы высокие значения индекса рассматривались как низкие).

  • REVERSEНаправление значений индекса будет обращено.
  • NO_REVERSEНаправление значений индекса не будет обращено. Это значение по умолчанию
Boolean
post_min_max
[min1, max1], [min2, max2]
(Дополнительный)

Минимум и максимум выходных значений индекса. Этот пересчет применяется после объединения пересчитанных переменных. Если значения не указаны, выходной индекс не пересчитывается.

Value Table
post_reclass
[post_reclass,...]
(Дополнительный)

Задает метод, который будет использоваться для классификации выходного индекса. Для каждого выбранного варианта будет предоставлено дополнительное выходное поле.

  • EQINTERVALБудут созданы классы путем разделения диапазона значений на одинаковые по размеру интервалы.
  • QUANTILEБудут созданы классы, в каждом из которых содержится одно и то же количество записей.
  • STDDEVКаждая переменная будет стандартизирована путем вычитания среднего значения и деления на среднеквадратическое отклонение (называемое z-оценка). Полученные значения будут находиться в диапазоне от -3 до 3.
  • CUSTРазбиение на классы и значения с классами будут заданы с помощью параметра post_custom_classes.
String
post_num_classes
(Дополнительный)

Количество классов, которые будут использоваться для методов равных интервалов и классификации квантилей.

Long
post_custom_classes
[[min1, max1], [min2, max2],...]
(Дополнительный)

Верхние границы и классифицированные значения для пользовательского метода классификации. Например, вы можете использовать эту переменную для классификации индекса, содержащего значения от 0 до 100, на классы, представляющие низкие, средние и высокие значения, на основе пользовательских значений перерыва.

Value Table

Производные выходные данные

ИмяОписаниеТип данных
updated_table

Обновленная входная таблица.

Feature Layer; Table View
output_layer_group

Если входные данные представляют собой класс пространственных объектов, и класс пространственных объектов указан в параметре out_table, предоставляется составной слой, отображающий слой для поля индекса, поля процентиля и каждого из выбранных вариантов классификации.

Group Layer

Пример кода

CalculateCompositeIndex, пример 1 (окно Python)

Скрипт Python, демонстрирующий использование функции CalculateCompositeIndex.


import arcpy
arcpy.stats.CalculateCompositeIndex(
    in_table=r"C:\MyData.gdb\CommunityCharacteristics", 
    out_table=r"C:\MyData.gdb\CommunityCharacteristicsIndex",
    in_variables=["ASTHMA_Prevalence_Percent", "Health_NoInsurance_Percent", 
                    "BelowPovertyLine_Percent"],
    index_preset="MEAN_SCALED")
CalculateCompositeIndex, пример 2 (автономный скрипт)

Скрипт Python, демонстрирующий использование функции CalculateCompositeIndex.


# Import system modules 
import arcpy 
import os 

try: 
    # Set the workspace and overwrite properties
    arcpy.env.workspace = r"C:\temp\temp.gdb" 
    arcpy.env.overwriteOutput = True 
    
    # Set the input point feature parameters
    input_features = os.path.join(arcpy.env.workspace, "CommunityCharacteristics")

    # Set a list of variables that will be combined into an index
    input_variables = ["ASTHMA_Prevalence_Percent", "Health_NoInsurance_Percent", 
                       "BelowPovertyLine_Percent"]

    # Set the output name that will contain the index values.
    output_features = os.path.join(arcpy.env.workspace, "CommunityCharacteristicsIndex")

    # Set the method to scale the input variables
    preprocessing_method = "PERCENTILE"

    # Set the method to combine the input variables
    combination_method = "MEAN"
    variable_weights = [["ASTHMA_Prevalence_Percent", 2],
                        ["Health_NoInsurance_Percent", 1],
                        ["BelowPovertyLine_Percent", 1]]

    # Set the output settings
    output_index_name = "Asthma_Needs_Index"
    output_index_range = "0 100"
    output_classification = "QUANTILE"
    output_classification_num_classes = 5

    # Call the tool using the parameters defined above.
    arcpy.stats.CalculateCompositeIndex(
        in_table=input_features,
        in_variables=input_variables, 
        out_table=output_features,
        index_preset="CUSTOM",
        preprocessing=preprocessing_method,
        index_method=combination_method,
        index_weights=variable_weights,
        out_index_name=output_index_name,
        post_min_max=output_index_range,
        post_reclass=output_classification,
        post_num_classes=output_classification_num_classes)

except arcpy.ExecuteError:
    # If an error occurred when running the tool, print the error message.
    print(arcpy.GetMessages())