Обзор группы инструментов Data Engineering

Группа инструментов Data Engineering содержит инструменты для подготовки полей к рабочим процессам анализа, такие как преобразование, стандартизация, кодировка и переклассификация значений. Эти инструменты разработаны, чтобы наборы данных были чистыми, согласованными и готовыми к рабочим процессами моделирования и анализа.

ИнструментОписание

Кодировать поле

Преобразует категорийные значения (строка, целое число или дата) в несколько числовых полей, каждое из которых представляет определенную категорию. Закодированные числовые поля могут использоваться в большинстве научных данных и статистических рабочих процессов, включая регрессионные модели.

Статистика поля в таблицу

Создает таблицу описательной статистики для одного или нескольких входных полей таблицы или класса объектов.

Переклассифицировать поле

Переклассифицирует значения в числовом или текстовом поле в классы на основе границ, определенных вручную, или применяя метод переклассификации.

Стандартизировать поле

Стандартизирует значения в полях, конвертируя их в значения, соответствующие заданному масштабу. Методы стандартизации включают z-оценку, минимум-максимум, абсолютный максимум и надежную стандартизацию.

Трансформировать поля

Трансформирует непрерывные значения в одно или несколько полей, путем применения математических функций к каждому значению и изменению формы распределения. Методы трансформирования в инструменте включают логарифм, квадратный корень, Box-Cox, множественную инверсию, квадрат, экспоненты и обратный Box-Cox.

Инструменты в группе инструментов Data Engineering

Связанные разделы