Использование ASCII или текстового файла

В AllSource вам доступны данные в текстовых файлах с разделителями и работа с ними, как с обычными таблицами. На панели Каталог и в диалоговом окне Добавить данные имеется перечень файлов с расширениями .txt, .asc, .csv, .psv, .tsv или .tab; этим файлам присвоен тип текстового файла.

По умолчанию файлы с расширениями .txt, .asc или .csv распознаются как файлы с разделителями-запятыми, файлы с расширением .psv интерпретируются как разделенные вертикальной чертой, а файлы с расширением .tsv или .tab интерпретируются как разделенные табуляцией по умолчанию. Любой файл с одним из этих расширений будет распознан, как табличный текстовый файл, даже если в нем нет никаких табличных данных. Если вы пытаетесь отобразить текстовый файл, не содержащий табличных данных, данные будут отображены в виде таблицы, если возможно, или произойдет ошибка. Чтобы избежать этой ошибки, убедитесь, что текстовые файлы с разделителями имеют расширение .csv или .tab, чтобы отличить текстовые файлы с данными с разделителями от неформатированных текстовых файлов.

Первая строка текстового файла может содержать заголовки столбцов, и последующие строки могут содержать координаты и атрибуты. Используйте запятые или табуляции для разделения столбцов. Ниже приводится пример текстового файла с запятыми в качестве разделителя:


x,y,ID,color
8.6,5.6,001,blue
99.3,77.0,002,blue and red
8.01,44.3,003,orange

Как определяется информация о координатах

Если текстовый файл с разделителями содержит информацию о координатах, например, данные x,y, AllSource распознает эту информацию о координатах либо в виде числовых полей, которые можно использовать для отображения этих данных, либо в виде слоя или входных данных для задач, например, геокодирования. В приведенном выше примере информация о координатах была простой и легко распознаваемой, она содержалась в полях x и y.

Иногда необходимая информация хранится в другом формате или использует другие наименования. Например, если координаты хранятся в текстовом поле в градусах, минутах и секундах (например, -120 13 58), они будут преобразованы и отображены в десятичных градусах.

В случаях с форматами с одним полем, например, UTM, наряду с исходным полем UTM используются два других поля, к которым добавлены _X и _Y и в которых отображается информация о координатах в десятичных градусах. Например, когда вы откроете текстовое поле с именем UTM, вы увидите три поля: UTM, UTM_X и UTM_Y.

В случае текстовых полей с двумя полями, такими как широта и долгота, оригинальные поля сохраняются вместе с двумя новыми полями, которые будут содержать информацию о координатах, преобразованных в десятичные градусы. Например, когда вы открываете текстовый файл с двумя текстовыми полями Lat и Lon, добавляются два поля: Lat_D и Lon_D. Хранимая числовая информация поддерживается в текстовых файлах во множестве форматов. См. раздел Поддерживаемые форматы обозначений для знакомства со списком таких форматов, включая подробное описание поддерживаемого обозначения.

Для отображения содержимого текстового файла в формате, отличном от десятичных градусов, используйте инструмент Конвертировать обозначения координат, который преобразует информацию о координатах.

Имена полей

Для имен полей в файлах ASCII и текстовых файлах действуют те же ограничения, что и для имен полей в классах пространственных объектов базы геоданных. См. раздел Имена полей в разделе Определение полей в таблицах.

Единственным неподдерживаемым символом является одиночные знаки кавычек. Следует отредактировать имена полей в текстовых файлах с разделителями, чтобы удалить одиночные двойные кавычки или заменить их на другой символ.

Изменение форматирования текстовых файлов

При встраивании информации из текстового файла с разделителями для отображения в AllSource поддерживаются все основные случаи отображения текстовых файлов. Настройки, заданные в файле информации о схеме (schema.ini), который используется текстовым драйвером Microsoft ODBC для хранения данных описательной информации, сохраняются и помогают определить, каким образом следует отображать текстовый файл. В предыдущих версиях файлы с расширением schema.ini не были необходимыми для отображения информации из текстовых файлов с разделителями.

Файл schema.ini создается автоматически в местоположении файлов при открытии текстового файла с разделителями, содержащего поле, которое нельзя однозначно определить. Он выполняет предположение о формате этого поля. Если информация в текстовом файле с разделителями отображается корректно, то вы можете оставить файл schema.ini. Если тип файла распознан неверно, вы можете отредактировать файл schema.ini, чтобы изменить способ отображения информации. Удалите или переименуйте файл schema.ini, чтобы проверить, как обрабатывается информация в текстовом файле с разделителями.

В следующем примере показано, как изменить файл schema.ini, чтобы изменить стандартное поведение. В данном случае, поле PLOTS отображается как поле с типом Text, но оно интерпретируется, как поле с типом Double.

[Trees.CSV]
Col14=PLOTS Text

Необходимо создать файл schema.ini, если его еще нет, чтобы изменить способ отображения этих файлов. Для получения дополнительной информации о файле schema.ini найдите schema.ini на веб-сайте Microsoft MSDN.

Если вы собираетесь редактировать файл schema.ini, необходимо учитывать следующее:

  • Если значения атрибутов будут заключены в специальные символы, например, двойные кавычки, то поля будут определены в качестве текстовых. Убедитесь, что для числовых полей не используются двойные кавычки.
  • Если вы не хотите обновлять файл schema.ini, но хотите, чтобы все поля имели формат значений с плавающей точкой, убедитесь в том, что в первой строчке с данными имеется знак десятичного разделителя, и тогда все значения будут иметь формат значений с плавающей точкой. Например, подготовьте текстовый файл, как показано ниже:
    ID Name Number 
    1 One 1.0
    2 Two 2.4564
    3 Three 3.45464