Сжатие данных файловой базы геоданных

Чтобы уменьшить требования к хранению информации, можно сжать таблицы и классы объектов файловой базы геоданных (вместе называемые наборами данных) в формат, предназначенный только для чтения. После сжатия скорость отображения данных и обработки запросов сопоставима со скоростью для несжатых данных. Вы можете заметить, что некоторые операции станут выполняться немного быстрее, а другие – немного медленнее.

Существует два типа сжатия, применимые к данным файловой базы геоданных: без потерь и с потерей качества. При использовании сжатия без потери качества информация не теряется независимо от системы координат и типов атрибутивных данных, содержащихся в базе классов объектов и таблиц. Все значения с плавающей точкой при этом сжатии будут сохранены. Сжатие с потерями позволяют получить на 20 процентов лучший результат для файловой базы геоданных, но значения с плавающей точкой будут изменены. Сжатие с потерей качества является хорошим вариантом в случае, если вам требуется максимальное сжатие ваших данных, точность которых не очень велика, либо вы не сильно беспокоитесь о сохранении максимальной точности своих данных, к примеру, вы выполняете сжатие географических данных масштаба 1:1 000 000 и мельче.

Сжатые наборы данных отличаются от не сжатых в редактировании: сжатый набор доступен только для чтения и его нельзя отредактировать, а можно только переименовать, изменить атрибутивные индексы и метаданные.

Сжатие идеально подходит для наборов данных, не требующих дальнейшего редактирования. Однако, при необходимости восстановления исходного формата «чтение/запись» сжатые наборы данных могут быть всегда переведены в несжатый формат.

Сжатие данных в ArcGIS AllSource

Вы можете сжать базу геоданных, набор данных, отдельный класс объектов или таблицу, используя инструмент геообработки Сжать данные файловой базы геоданных и отменить сжатие посредством инструмента геообработки Отменить сжатие данных файловой базы геоданных. Оба инструмента находятся в группе инструментов Файловая база геоданных набора Управление данными.

Преимущества сжатия

Сжатые данные файловой базы геоданных занимают на диске меньше места, чем несжатые, но в то же время обеспечивают высокую производительность при отображении и обработке запросов.

Степень возможного сжатия данных классов пространственных объектов и таблиц может изменяться от незначительной до показателя, превышающего 4:1. Состав координат, число атрибутивных полей и их содержимое определяют степень возможного сжатия.

Самым важным фактором, определяющим уровень сжатия, является число вершин, приходящихся на объект. Точечные объекты и простые линии с двумя вершинами сжимаются лучше, чем линии или полигоны с множеством вершин. Классы точечных объектов адресов или дорог с несколькими вершинами могут быть сжаты с отношением 3:1, в то время как класс объектов речной сети или данных о почвенном покрове с объектами, образованными большим количеством вершин, может быть сжат только с отношением 3:2. Объекты, состоящие из большого количества вершин, уже хранятся эффективно в несжатом формате, поэтому возможность их сжатия значительно меньше. Поля атрибутов также играют роль в определении уровня сжатия: поля с типом text и integer, а также поля с типом date сжимаются лучше, чем поля с типами float и double.

В расположенной ниже таблице сравниваются размеры файлов в сжатом и несжатом форматах. Класс пространственных объектов, который по сравнению с исходным размером был максимально сжат, – Europe places – является классом точечных объектов. Класс пространственных объектов, который по сравнению с исходным размером был сжат в минимальной степени, – Mexico roads – является классом линейных объектов, содержащим объекты, которые образованы большим количеством вершин.

Сравнение обычного и сжатого форматов

Класс пространственных объектовРазмер без сжатияРазмер со сжатиемСтепень сжатия

Europe places (61541 точечных объектов, 14 полей)

6,2 МБ

0,67 МБ

9.3

Переписные райны США (8 205 055 точечных объектов, 11 полей)

705 МБ

80 МБ

8,8

California roads (2092079 линейных объектов, 29 полей)

329 МБ

60 МБ

5.5

Europe rails (383531 линейных объектов, 12 полей)

58 МБ

9,7 МБ

6.0

Calgary addresses (285,285 point features, 8 fields)

21 МБ

6,4 МБ

3.3

Calgary buildings (319000 полигональных объектов, 9 полей)

48 МБ

20 МБ

2.4

U.S. rivers and streams (2844231 линейных объектов, 9 полей)

878 МБ

288 МБ

3.0

U.S. counties (3140 полигональных объектов, 57 полей)

1,6 МБ

0,8 МБ

2.5

Europe water (232375 полигональных объектов, 10 полей)

176 МБ

70 МБ

2.5

U.S. traffic analysis zones (166747 полигональных объектов, 10 полей)

68 МБ

35 МБ

1.9

Mexico roads (5847 линейных объектов, 7 полей)

3,5 МБ

1,6 МБ

2.2

Таблицы обычно сжимаются с отношением свыше 2:1. Таблицы обычно сжимаются с отношением, превышающим 2:1, причем повторы значений являются самым важным фактором: поля, значения которых при переходе от одной записи к другой часто не меняются, сжимаются лучше, чем поля с множеством уникальных значений. Как и в классе объектов текстовые, целочисленные поля и поля даты сживаются лучше, чем поля с плавающей точкой и поля двойной точности.

Несмотря на то, что вы можете сжимать данные любого размера, эффективнее всего использовать сжатие для больших объемов данных. Сжатие больших наборов данных или большого количества средних и небольших наборов данных может сэкономить вам значительный объем свободного дискового пространства, что может оказаться очень актуальным, если у вас имеется дефицит свободного места на диске или если вы пытаетесь уместить свои данные на один CD или DVD диск. Например, файловую базу геоданных переписи населения США размером 8,9 ГБ можно сжать до 3,4 ГБ – этого достаточно, чтобы она поместилась на DVD.

При минимизации требований к объему места на диске для хранения вы должны помнить о том, что сжатие файловой базы геоданных не является единственной находящейся в вашем расположении опцией. Если ваши данные хранятся с меньшим разрешением x,y, чем необходимо, то вы можете уменьшить объем, необходимый для хранения данных, перезагрузив данные перед сжатием с более крупным разрешением. Например, если у вас есть набор данных, хранящий по умолчанию информацию с разрешением 1/10 мм, но вы знаете, что точность данных составляет лишь 1 м, можно заново загрузить данные с метровым разрешением. Перезагрузка класса объектов зданий г. Калгари разрешения 1/10 мм в метровом разрешении уменьшит объем данных с 48 до 31 МБ. Сжатие класса пространственных объектов объемом 31 МБ позволяет дополнительно уменьшить объем данных до 12 МБ.

Влияние разрешения x,y на место на диске

Класс пространственных объектовРазмер без сжатияРазмер со сжатием

Calgary buildings, разрешение 0,0001 метра

48 МБ

20 МБ

Здания г. Калгари, разрешение 1.0 м

31 МБ

12 МБ

Чтобы перезагрузить класс пространственных объектов с другим разрешением, вам необходимо экспортировать данные в новый класс пространственных объектов. Щелкните правой кнопкой класс объектов на панели Каталог и выберите Экспорт > В базу геоданных (выберите команду Несколько для экспорта нескольких классов объектов одновременно). Задайте новое разрешение в диалоговом окне Параметры среды перед выполнением экспорта. Для получения более подробной информации см. Разрешение XY, Разрешение Z.

Что вы можете сжать

Можно сжать базу геоданных, набор классов объектов, отдельный класс пространственных объектов или таблицу. При сжатии базы геоданных происходит сжатие всех классов пространственных объектов и таблиц, хранимых в ней. Точно так же, при сжатии набора классов объектов происходит сжатие всех содержащихся в нем классов пространственных объектов. Любой элемент, который не может быть сжат, будет пропущен. Ниже описаны элементы, которые можно сжать, и те, которые нельзя.

Данные файловой базы геоданныхМогут быть сжаты

База геоданных

Да (Все векторные классы пространственных объектов и таблицы в базе геоданных могут быть сжаты.)

Набор данных каталога

Да

Класс пространственных объектов (только отдельные классы)

Да

Набор классов объектов

Да (Все векторные классы пространственных объектов в наборе классов объектов могут быть сжаты.)

Набор данных мозаики

Да (Набор данных сжимается, но файлы мозаичных изображений, на которые ссылается набор данных, — нет.)

Набор сетевых данных

Да

Набор данных ориентированных изображений

Да (Набор данных сжимается, но файлы изображений, на которые ссылается набор данных, — нет.)

Набор данных участков

Да

Набор растровых данных

Нет

Таблица

Да

Terrain

Нет

Топология

Да

Сеть трассировки

Да

Набор данных траектории

Да

Инженерная сеть

Да

Примечание:

  • Если какой-либо из перечисленных выше типов наборов данных содержит один или несколько из следующих типов данных полей, набор данных не будет сжат:
    • Большое целое (Big integer)
    • Только дата
    • Только время
    • Сдвиг метки времени
    • 64-разрядные идентификаторы объектов
  • Вы не можете сжать или перевести в несжатый формат отдельный класс пространственных объектов в наборе классов объектов. Вы сжимаете и отменяете сжатие пространственного набора – то есть всех его объектов.

Ограничения при работе со сжатыми данными

Помимо возможности редактирования сжатого класса объектов или таблицы нельзя изменить следующие дополнительные свойства:

  • Информация о системе координат
  • Подтипы, атрибутивные домены и значения по умолчанию
  • Поля и их свойства
  • Представления

Единственными свойствами, которые могут быть изменены, являются псевдоним класса пространственных объектов или таблицы и атрибутивные индексы.

Сжатые наборы объектов позволяют добавлять несжатые классы объектов с использованием таких операций, как создание пустого класса объектов, копирование, вставка и импорт данных. Это приводит к появлению разнородной среды, где некоторые классы пространственных объектов в наборе классов объектов сжаты, а некоторые – нет. Если набор классов объектов содержит и сжатые, и несжатые классы пространственных объектов, то вы не сможете редактировать несжатые классы пространственных объектов. Чтобы отредактировать класс пространственных объектов, вам придется перевести в несжатый формат все классы из набора классов объектов.

Можно сжимать классы объектов в классах отношений и топологиях. Однако для этих типов данных существуют следующие ограничения:

  • Нельзя создать топологию для сжатых классов объектов.
  • Если вы сжали одну «сторону» класса отношений, то независимо от того, когда вы это сделали, вы уже не сможете редактировать другую «сторону». Это происходит в связи с тем, что при обновлении несжатой «стороны» может потребоваться автоматическое обновление сжатой «стороны», которая хранится в формате «только для чтения».
  • Вы не можете изменять параметры топологии, если ее классы пространственных объектов сжаты.