Аргументы глубокого обучения

Доступно с лицензией Image Analyst.

Аргументы - один из вариантов управления способов обучения и использования моделей глубокого обучения. В первой таблице ниже перечислены поддерживаемые аргументы модели для обучения моделей глубокого обучения. Во второй таблице перечислены аргументы, контролирующие, как модели глубокого обучения используются для вывода.

Обучающие аргументы

Следующие аргументы в Модели глубокого обучения доступны для обучения моделей. Аргументы различаются в зависимости от архитектуры модели. Вы можете менять значения этих аргументов для обучения моделей.

Тип моделиАргументКорректные значения

Change detector (классификация пикселов)

attention_type

PAM (Pyramid Attention Module) или BAM (Basic Attention Module).

chip_size

Целые числа от 0 до размера изображения.

monitor

valid_loss, precision, recall и f1.

ConnectNet (классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

gaussian_thresh

0.0 до 1.0. По умолчанию 0.76.

monitor

valid_loss, accuracy, miou и dice.

mtl_model

linknet или hourglass.

orient_bin_size

Положительное число. Значение по умолчанию равно 20.

orient_theta

Положительное число. Значение по умолчанию - 8.

DeepLabV3 (классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

class_balancing

true или false.

focal_loss

true или false.

ignore_classes

Допустимые значения классов.

monitor

valid_loss и accuracy.

mixup

true или false.

Image captioner (преобразование изображения)

chip_size

Целые числа от 0 до размера изображения.

Аргумент decode_params состоит из следующих шести параметров:

  • embed_size
  • hidden_size
  • attention_size
  • teacher_forcing
  • dropout
  • pretrained_emb

По умолчанию – {'embed_size':100, 'hidden_size':100, 'attention_size':100, 'teacher_forcing':1, 'dropout':0.1, 'pretrained_emb':False}.

monitor

valid_loss, accuracy, corpus_bleu и multi_label_fbeta.

MMDetection (выявление объекта)

chip_size

Целые числа от 0 до размера изображения.

model

atss, carafe, cascade_rcnn, cascade_rpn, dcn, detectors, double_heads, dynamic_rcnn, empirical_attention, fcos, foveabox, fsaf, ghm, hrnet, libra_rcnn, nas_fcos, pafpn, pisa, regnet, reppoints, res2net, sabl и vfnet.

model_weight

true или false.

MMSegmentation (классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

model

ann, apcnet, ccnet, cgnet, danet, deeplabv3, deeplabv3plus, dmnet , dnlnet, emanet, encnet, fastscnn, fcn, gcnet, hrnet, mobilenet_v2, mobilenet_v3, nonlocal_net, ocrnet, ocrnet_base, pointrend, psanet, pspnet, resnest, sem_fpn, unet и upernet.

model_weight

true или false.

Multi Task Road Extractor (классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

gaussian_thresh

0.0 до 1.0. По умолчанию 0.76.

monitor

valid_loss, accuracy, miou и dice.

mtl_model

linknet или hourglass.

orient_bin_size

Положительное число. Значение по умолчанию равно 20.

orient_theta

Положительное число. Значение по умолчанию - 8.

Pyramid Scene Parsing Network (классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

class_balancing

true или false.

focal_loss

true или false.

ignore_classes

Допустимые значения классов.

monitor

valid_loss или accuracy.

mixup

true или false.

pyramid_sizes

[уровень свертки 1, уровень свертки 2, ... , уровень свертки n]

use_net

true или false.

RetinaNet (выявление объектов)

chip_size

Целые числа от 0 до размера изображения.

monitor

valid_loss или average_precision.

ratios

Значение отношения 1, значение отношения 2, значение отношения 3.

По умолчанию – 0.5,1,2.

scales

[значение шкалы 1, значение шкалы 2, значение шкалы 3]

По умолчанию – [1, 0.8, 0.63].

SAMLoRA (классификация пикселов)

class_balancing

true или false.

ignore_classes

Допустимые значения классов.

Single Shot Detector (выявление объектов)

chip_size

Целые числа от 0 до размера изображения.

grids

Целочисленные значения больше 0.

monitor

valid_loss или average_precision.

ratios

[значение по горизонтали, значение по вертикали]

zooms

Значение увеличения, где 1.0 - отсутствие увеличения.

Super-resolution используется для опорной модели SR3 (преобразование изображения).

attn_res

Целочисленные значения больше 0. По умолчанию это 16.

channel_mults 

Наборы целочисленных множителей, по умолчанию это [1, 2, 4, 4, 8, 8].

dropout

Значение с плавающей точкой. По умолчанию - 0.

inner_channel

Целочисленное значение больше 0. Значение по умолчанию - 64.

linear_start

Целочисленное значение времени. Значение по умолчанию 1e-02.

linear_end 

Целочисленное значение времени. Значение по умолчанию 1e-06.

n_timestep 

Целочисленное значение больше 0. Значение по умолчанию равно 1000.

norm_groups 

Целочисленное значение больше 0. Значение по умолчанию 32.

res_blocks

Целочисленное значение больше 0. Значение по умолчанию равно 3.

schedule 

linear, warmup10, warmup50, const, jsd, или cosine.

Значением по умолчанию является Линейная.

U-Net (классификация пикселов)

chip_size

Целые числа от 0 до размера изображения.

class_balancing

true или false.

focal_loss

true или false.

ignore_classes

Допустимые значения классов.

monitor

valid_loss или accuracy.

mixup

true или false.

Выводящие аргументы

Следующие аргументы доступны для, контроля, как обучаются модели глубокого обучения для вывода. Информация из параметра Определение модели используется для заполнения строки Аргументы в инструментах вывода. Аргументы различаются в зависимости от архитектуры модели. Предварительно обученные модели ArcGIS и пользовательские модели глубокого обучения могут включать дополнительные аргументы, которые поддерживаются инструментом.

АргументТип выводаКорректные значения

batch_size

Классифицировать объекты

Классифицировать пикселы

Выявить изменения

Выявить объекты

Целочисленные значения больше 0; обычно целое число в степени 2n.

direction

Классифицировать пикселы

Доступными опциями являются AtoB и BtoA.

Аргумент доступен только для архитектуры CycleGAN.

exclude_pad_detections

Выявить объекты

true или false.

Аргумент доступен только для SSD, RetinaNet, YOLOv3, DETReg, MMDetection и Faster RCNN.

merge_policy

Классифицировать пикселы

Выявить объекты

Доступные опции mean, max и min.

Для инструмента Классифицировать пикселы при помощи глубокого обучения аргумент доступен в архитектурах MultiTaskRoadExtractor и ConnectNet. Если аргумент isEdgeDetection присутствует в файле модели .emd, BDCN Edge Detector, HED Edge Detector, и MMSegmentation также являются доступными архитектурами.

Для инструмента Выявить объекты при помощи глубокого обучения аргумент доступен только для MaskRCNN.

n_timestep

Классифицировать пикселы

Целочисленное значение больше 0. По умолчанию, 200.

Этот аргумент доступен только для параметра Повышение разрешения с опорной моделью SR3.

nms_overlap

Выявить объекты

Значение с плавающей точкой от 0.0 до 1.0. Значение по умолчанию равно 0.1.

output_classified_raster

Выявить объекты

Путь и имя файла для выходного классифицированного растра.

Аргумент доступен только для MaXDeepLab.

padding

Классифицировать пикселы

Выявить изменения

Выявить объекты

Целочисленные значения больше 0 и меньше, чем половина значения размера листа.

predict_background

Классифицировать пикселы

true или false.

Аргумент доступен для UNET, PSPNET, DeepLab и MMSegmentation.

return_probability_raster

Классифицировать пикселы

true или false.

Если ArcGISLearnVersion 1.8.4 или новее в файле модели .emd, доступны архитектуры MultiTaskRoadExtractor и ConnectNet. Если ArcGISLearnVersion 1.8.4 или новее и IsEdgeDetection есть в файле модели .emd, также доступны архитектуры BDCN Edge Detector, HED Edge Detector, and MMSegmentation.

sampling_type

Классифицировать пикселы

ddim и ddpm.

Значение по умолчанию равно ddim.

Этот аргумент доступен только для параметра Повышение разрешения с опорной моделью SR3.

расписание

Классифицировать пикселы

linear, warmup10, warmup50, const, jsd, или cosine.

Значение по умолчанию задается равным значению, с которым обучалась модель.

Этот аргумент доступен только для параметра Повышение разрешения с опорной моделью SR3.

score_threshold

Классифицировать объекты

от 0 до 1.0.

test_time_augmentation

Классифицировать объекты

Классифицировать пикселы

true или false.

threshold

Классифицировать пикселы

Выявить объекты

от 0 до 1.0.

Для инструмента Классифицировать пикселы при помощи глубокого обучения, если ArcGISLearnVersion 1.8.4 или новее в файле .emd модели, доступны архитектуры MultiTaskRoadExtractor и ConnectNet. Если ArcGISLearnVersion 1.8.4 или новее и IsEdgeDetection есть в файле .emd модели, доступны архитектуры BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation.

Для инструмента Выявить объекты при помощи глубокого обучения этот агрумент доступен во всех архитектурах модели.

thinning

Классифицировать пикселы

true или false.

Если IsEdgeDetection присутствует в файле .emd модели, BDCNEdgeDetector, HEDEdgeDetector и MMSegmentation также являются доступными архитектурами.

tile_size

Классифицировать пикселы

Выявить объекты

Целочисленные значения больше 0 и меньше, чем половина значения размера изображения.

Для инструмента Классифицировать пикселы при помощи глубокого обучения, аргумент доступен только в архитектуре CycleGAN.

Для инструмента Выявить объекты при помощи глубокого обучения аргумент доступен только для MaskRCNN.

Связанные разделы