Los gráficos de dispersión se usan para averiguar la intensidad de la relación entre dos variables numéricas. El eje X representa la variable independiente, mientras que el eje Y representa la variable dependiente.
Los gráficos de dispersión permiten responder preguntas sobre los datos, por ejemplo: ¿cuál es la relación entre dos variables? ¿Cómo se distribuyen los datos? ¿Dónde están los valores atípicos?
Ejemplos
Los siguientes ejemplos muestran gráficos de dispersión utilizando dos variables, tres variables y bins.
Dos variables
Un departamento de obras públicas ha observado un aumento de fugas en la red de agua. El departamento quiere saber hasta qué punto afecta la longitud total de las tuberías al número de fugas, en comparación con el impacto de las propiedades de las tuberías, como antigüedad o circunferencia. Se puede utilizar un gráfico de dispersión para representar el número total de fugas en comparación con la longitud total de las tuberías de cada zona.
El departamento de obras públicas también quiere saber si hay alguna diferencia entre las tuberías inspeccionadas en distintas épocas del año. Al utilizar la opción Colorear por, el departamento puede dar estilo a los puntos con colores únicos para cada valor único en el campo especificado.
El gráfico de dispersión indica que la mayor parte de las inspecciones de las tuberías se realizaron en abril.
Un gráfico de dispersión puede utilizar un análisis de regresión para calcular la fuerza y la dirección de la relación entre las variables dependiente e independiente. Los modelos de estadísticas se ilustran con una línea recta o curva, dependiendo de la estadística del gráfico que ha seleccionado. Se puede agregar el valor R2 para dar una medida del impacto de la longitud de las tuberías en el número de fugas.
Agregar una tercera variable
Un departamento de obras públicas ha observado un aumento de fugas en la red de agua. El departamento quiere saber hasta qué punto afecta la longitud total de las tuberías al número de fugas, en comparación con el impacto de las propiedades de las tuberías, como antigüedad o circunferencia. El departamento también desea saber si hay una relación entre el número de fugas o la longitud de las tuberías y el coste por día (incluidos la construcción, el mantenimiento y las reparaciones y la pérdida de recursos por las fugas). Se puede utilizar un gráfico de dispersión con símbolos proporcionales para representar el número total de fugas en comparación con la longitud total de las tuberías de cada zona; el tamaño de los puntos representaría el coste por día.
Sugerencia:
Arrastre un campo numérico a su página y suéltelo en su gráfico de dispersión para aplicar símbolos graduados a su gráfico.
El departamento de obras públicas también quiere saber si hay alguna diferencia entre las tuberías inspeccionadas en distintas épocas del año. Al utilizar la opción Colorear por, puede dar estilo a los puntos con colores únicos para cada valor único en el campo especificado.
El gráfico de dispersión indica que la mayor parte de las inspecciones de las tuberías se realizaron en abril.
Visualizar con bins
Un analista de SIG que trabaja para un consorcio de universidades quiere averiguar qué estados tienen universidades de alto valor. El analista comienza su análisis creando un gráfico de dispersión que muestra el coste de las universidades y los ingresos medios tras la graduación. El gráfico de dispersión muestra una relación positiva, pero los puntos están distribuidos con una densidad excesiva para revelar patrones más específicos.
El analista puede cambiar el estilo del gráfico a Bins para ver la distribución de los puntos en el gráfico de dispersión. El patrón revela que la mayor concentración de universidades tiene un coste de en torno a los 20.000 dólares y da lugar a unos ingresos inferiores a los 50.000 dólares.
Crear un gráfico de dispersión
Para crear un gráfico de dispersión, siga estos pasos:
- Seleccione dos campos numéricos o de índice/ratio .
Sugerencia:
Puede buscar campos en la barra de búsqueda del panel de datos.
- Cree un gráfico de dispersión siguiendo estos pasos:
- Arrastre los campos seleccionados a una nueva tarjeta.
- Pase el puntero por la zona de colocación del Gráfico.
- Suelte los campos seleccionados en el Gráfico de dispersión.
Sugerencia:
También puede crear gráficos usando el menú Gráfico situado encima del panel de datos o el botón Tipo de visualización de una tarjeta existente. Para el menú Gráfico, solo se habilitarán los gráficos compatibles con su selección de datos. Para el menú Tipo de visualización, solo se mostrarán visualizaciones compatibles (incluidos mapas, gráficos o tablas).
También se pueden crear gráficos de dispersión usando Ver gráficos de dispersión, al cual se accede haciendo clic en el botón Acción en Buscar respuestas > ¿Cómo está relacionado?.
Notas de uso
El botón Opciones de capa abre el panel Opciones de capa. Puede utilizar el panel Opciones de capa para ver la leyenda, cambiar el tipo de símbolos del gráfico y cambiar el estilo del gráfico.
La pestaña Leyenda muestra los símbolos y valores del gráfico. Para cambiar el color asociado a un valor, haga clic en el símbolo y elija un color de la paleta o introduzca un valor hexadecimal (disponible cuando se aplica una variable Colorear por). El botón Leyenda emergente muestra la leyenda como una tarjeta separada en la página. La leyenda se puede utilizar para realizar selecciones en el gráfico.
La pestaña Simbología se utiliza para cambiar los parámetros Color por y Tipo de símbolo. El campo Color por se utiliza para dar estilo al gráfico con valores únicos y debe ser un campo de cadena. El parámetro Tipo de símbolo se utiliza para cambiar el estilo del gráfico entre puntos y franjas. Si Tipo de símbolo es Bins, están disponibles las siguientes configuraciones adicionales:
- Definir el tamaño de los bins ajustando el valor Resolución. El valor predeterminado de Resolución se calcula para su dataset utilizando la regla de Sturges.
- Especificar la configuración de Valor de transición. Si el número de entidades de puntos de la extensión de gráfico es menor que el valor de transición, el gráfico mostrará las entidades de puntos. Si el número de puntos de la extensión de gráfico es mayor o igual que el valor de transición, se dará estilo al gráfico con bins. El valor predeterminado de Valor de transición es 2000.
- El parámetro Mostrar ventana emergente determina si las ventanas emergentes se muestran cuando se sitúa sobre un bin y la información incluida en las ventanas emergentes.
La pestaña Apariencia se utiliza para ajustar las siguientes propiedades de los símbolos:
- En el caso de los puntos, puede cambiar el tamaño del símbolo, el color del símbolo (solo para un símbolo), el grosor del contorno, el color del contorno y la transparencia de la capa.
- En el caso de los bins, puede cambiar la paleta de colores, el grosor del contorno del bin, el color del contorno del bin y la transparencia de la capa.
Para agregar una línea de mejor ajuste al gráfico de dispersión, use el botón Estadísticas de gráfico . La línea de mejor ajuste puede ser Lineal, Exponencial o Polinómica. La ecuación de la línea de mejor ajuste y el valor R2 también se mostrarán en el gráfico.
Estadística | Descripción |
---|---|
Lineal | La regresión lineal trata de ajustar una línea recta a través de un conjunto de valores de forma que las distancias entre los valores y la línea ajustada sea lo más pequeña posible. Una línea con pendiente positiva (de la parte inferior izquierda a la parte superior derecha del gráfico) indica una relación lineal positiva. Las relaciones positivas significan que los valores aumentan juntos. Una línea con pendiente negativa indica una relación lineal negativa. Una relación lineal negativa significa que un valor disminuye cuando otro aumenta. Se pueden usar medidas de la bondad de ajuste, como R2, para cuantificar la relación. Cuanto más cerca de 1, más intensa es la relación. |
Exponencial | Calcula una curva exponencial (hacia arriba) del mejor ajuste para modelar una relación no lineal en sus datos (R2 para regresión lineal en 0 o cerca de 0). |
Polinómica | Calcula una curva del mejor ajuste para una relación no lineal de sus datos (R2 para regresión lineal en 0 o cerca de 0). De manera predeterminada, se utiliza una ecuación polinómica de segundo grado para el cálculo. Puede cambiar la ecuación a una ecuación polinómica de tercer o cuarto grado. |
Para agregar una tercera variable numérica o de índice/ratio al diagrama de dispersión, seleccione un campo en el panel de datos y arrástrelo a la tarjeta del gráfico de dispersión existente (no disponible en un gráfico de dispersión con símbolos de bins). Como resultado, se obtendrá un gráfico de dispersión con símbolos proporcionales, en el que el tamaño de los puntos representa la magnitud de los datos de la tercera variable.
Utilice el botón Ejes de cambio para intercambiar las variables de los ejes x e y.
Utilice el botón Tipo de visualización para cambiar directamente entre un gráfico de dispersión y otras visualizaciones, como una tarjeta de KPI o una tabla de resumen.
Use el botón Voltear tarjeta para ver el reverso de la tarjeta. La pestaña Información de tarjeta proporciona información sobre los datos de la tarjeta y la pestaña Exportar datos permite a los usuarios exportar los datos desde la tarjeta.
Haga clic en el eje X o Y para cambiar la escala entre Lineal y Logarítmica.
Limitaciones
Los gráficos de dispersión en bins no están disponibles para algunas capas de entidades remotas. Si su capa de entidades remota no admite gráficos de dispersión en bins, puede copiar la capa en su libro de trabajo y crear un gráficos de dispersión en bins utilizando la copia.
La exportación de datos no está disponible para gráficos de dispersión en bins. Para poder exportar los datos de la parte posterior de un gráfico de dispersión, debe establecer el Tipo de símbolo como Símbolo único.
Las herramientas de zoom y las herramientas de selección no están disponibles en los informes publicados para gráficos de dispersión en bins con más de 100.000 entidades.