Группа инструментов Data Engineering содержит инструменты для подготовки полей к рабочим процессам анализа, такие как преобразование, стандартизация, кодировка и переклассификация значений. Эти инструменты разработаны, чтобы наборы данных были чистыми, согласованными и готовыми к рабочим процессами моделирования и анализа.
Инструмент | Описание |
---|---|
Преобразует категорийные значения (строка, целое число или дата) в несколько числовых полей, каждое из которых представляет определенную категорию. Закодированные числовые поля могут использоваться в большинстве научных данных и статистических рабочих процессов, включая регрессионные модели. | |
Создает таблицу описательной статистики для одного или нескольких входных полей таблицы или класса объектов. | |
Переклассифицирует значения в числовом или текстовом поле в классы на основе границ, определенных вручную, или применяя метод переклассификации. | |
Стандартизирует значения в полях, конвертируя их в значения, соответствующие заданному масштабу. Методы стандартизации включают z-оценку, минимум-максимум, абсолютный максимум и надежную стандартизацию. | |
Трансформирует непрерывные значения в одно или несколько полей, путем применения математических функций к каждому значению и изменению формы распределения. Методы трансформирования в инструменте включают логарифм, квадратный корень, Box-Cox, множественную инверсию, квадрат, экспоненты и обратный Box-Cox. |