La herramienta Pivote convierte un dataset largo en un dataset amplio utilizando valores diferentes de un campo existente para crear campos nuevos.
Ejemplos
La herramienta Pivote se puede utilizar en situaciones como las siguientes:
- Tiene un dataset largo con muchos registros y pocos campos, y desea formatearlo para que tenga pocos registros y muchos campos.
- Tiene un dataset que contiene registros de observaciones de campo de varios años y desea resumir los valores por año.
Parámetros
La siguiente tabla muestra los parámetros de la herramienta Pivote:
Parámetro | Descripción |
---|---|
Dataset de entrada | El dataset que se va a pivotar. |
Campos de entrada | Uno o varios campos utilizados para definir los registros únicos en el dataset de salida. Los registros con valores coincidentes se agregarán mediante el uso de las funciones de agregación. |
Campo pivote | El campo que contiene los valores que se van a transformar en campos nuevos en el dataset de salida. |
Campo de valor | El campo utilizado para determinar los valores de los nuevos registros. |
Funciones de agregación | La función o funciones utilizadas para calcular los nuevos valores. |
Notas de uso
Utilice el parámetro Dataset de entrada para identificar el dataset que se va a pivotar.
Utilice el parámetro Campos de entrada para identificar uno o más campos que contengan valores por los que agrupar. Los valores únicos del campo o campos especificados se convertirán en los registros del dataset de salida. No se puede especificar el mismo campo para los campos de entrada y el campo de pivote o campo de valor.
Utilice el parámetro del campo Pivote para identificar el campo que contiene los valores que se utilizarán para crear los nuevos nombres de campo en el dataset de salida.
El parámetro Funciones de agregación se utiliza para determinar cómo se calcularán los valores de los registros agrupados. Están disponibles las siguientes funciones de agregación:
- Suma: la suma de valores numéricos en un campo. La suma de [null, 1, 3] es 4.
- Min: valor mínimo de un campo numérico o de fecha. El mínimo de [0, 2, null] es 0.
- Máx: valor máximo de un campo numérico o de fecha. El máximo de [0, 2, null] es 2.
- Valor medio: el valor medio de los valores numéricos. La media de [0, 2, null] es 1.
- Desviación estándar: desviación estándar de un campo numérico. La desviación estándar de [null, 1, 1, 1] es 0.
- Recuento: número de valores no nulos. Se puede utilizar en un campo de cualquier tipo. El recuento de [null, "hello", "world"] es 2.
- Cualquiera: valor de muestra de un campo de cualquier tipo.
Salidas
La salida de la herramienta es un dataset que contiene los siguientes campos y valores:
- Todos los campos especificados mediante el parámetro Campos de entrada. La salida contendrá un registro por cada valor único encontrado en el campo o combinación de campos.
- Nuevos campos para cada valor único en el campo especificado mediante el parámetro del campo Pivote. Estos campos contendrán valores agregados del campo especificado mediante el parámetro del campo Valor. Por ejemplo, si el campo pivote contiene dos valores únicos, California y Washington, y usted calcula las funciones de agregación de Valor medio y Cualquiera, el resultado contendrá cuatro campos nuevos: MEAN_California, ANY_California, MEAN_Washington y ANY_Washington.
Si el campo Pivote contiene valores nulos, se agregará un campo llamado null. Si el campo Pivote contiene cadenas de caracteres vacías, se agregará un campo llamado _.
Limitaciones
A continuación se indican las limitaciones conocidas de la herramienta Pivote:
- Los nombres de campo no distinguen entre mayúsculas y minúsculas.Si el parámetro del campo Pivote contiene valores de texto coincidentes con mayúsculas y minúsculas, se cambiará el nombre de los campos de salida para evitar duplicados.
- Los nombres de campos que contienen caracteres no válidos o que empiezan con un número se cambian. Si el parámetro del campo Pivote contiene varios valores que entrarían en conflicto al cambiarles el nombre, estos se cambiarán para evitar duplicados.
- Se admite un máximo de 1000 valores distintos en el parámetro del campo Pivote. Si se encuentran más de 1000 valores distintos, se generará un error.
- La herramienta Pivote requiere un escaneo de todo el dataset de entrada para determinar los nuevos valores de campo. Si el rendimiento de las herramientas posteriores se convierte en un problema, plantéese limitar el tamaño del dataset de entrada.
Requisitos de licencia
Se requieren las siguientes licencias y configuraciones:
- Tipo de usuario Creator o Professional
- Rol de publicador, moderador o administrador, o rol personalizado equivalente
Para obtener más información sobre los requisitos de Data Pipelines, consulte Requisitos.