Skip To Content

Crear y utilizar un gráfico de dispersión

Los gráficos de dispersión se usan para averiguar la intensidad de la relación entre dos variables numéricas. El eje X representa la variable independiente, mientras que el eje Y representa la variable dependiente.

Los gráficos de dispersión permiten responder preguntas sobre los datos, por ejemplo: ¿cuál es la relación entre dos variables? ¿Cómo está distribuido? ¿Dónde están los valores atípicos?

Ejemplos

Dos variables

Un departamento de obras públicas ha observado un aumento de fugas en la red de agua. El departamento quiere saber hasta qué punto afecta la longitud total de las tuberías al número de fugas, en comparación con el impacto de las propiedades de las tuberías, como antigüedad o circunferencia. Se puede utilizar un gráfico de dispersión para representar el número total de fugas en comparación con la longitud total de las tuberías de cada zona.

Gráfico de dispersión de la longitud total de las tuberías y el número total de fugas

El departamento de obras públicas también quiere saber si hay alguna diferencia entre las tuberías inspeccionadas en distintas épocas del año. Al utilizar la opción Colorear por, puede dar estilo a los puntos con colores únicos para cada valor único en el campo especificado.

Gráfico de dispersión categorizado por el mes de la fecha de la encuesta

El gráfico de dispersión anterior indica que la mayor parte de las inspecciones de las tuberías se realizó en abril.

Un gráfico de dispersión puede utilizar un análisis de regresión para calcular la fuerza y la dirección de la relación entre las variables dependiente e independiente. Los modelos de estadísticas se ilustran con una línea recta o curva, dependiendo de la estadística del gráfico que ha seleccionado. Se puede agregar el valor R2 para dar una medida del impacto de la longitud de las tuberías en el número de fugas.

Gráfico de dispersión categorizado por mes que muestra la línea que mejor se ajusta

Agregar una tercera variable

Un departamento de obras públicas ha observado un aumento de fugas en la red de agua. El departamento quiere saber hasta qué punto afecta la longitud total de las tuberías al número de fugas, en comparación con el impacto de las propiedades de las tuberías, como antigüedad o circunferencia. El departamento también desea saber si hay una relación entre el número de fugas o la longitud de las tuberías y el coste por día (incluidos la construcción, el mantenimiento y las reparaciones y la pérdida de recursos por las fugas). Se puede utilizar un gráfico de dispersión con símbolos proporcionales para representar el número total de fugas en comparación con la longitud total de las tuberías de cada zona; el tamaño de los puntos representaría el coste por día.

Gráfico de dispersión con coordenadas cartesianas que muestra el efecto de la longitud de las tuberías en el número de fugas

Sugerencia:

Drag-N Drop Arrastre un campo numérico a su página y suéltelo en su gráfico de dispersión para aplicar símbolos graduados a su gráfico.

El departamento de obras públicas también quiere saber si hay alguna diferencia entre las tuberías inspeccionadas en distintas épocas del año. Al utilizar la opción Colorear por, puede dar estilo a los puntos con colores únicos para cada valor único en el campo especificado.

Gráfico de dispersión que muestra coordenadas cartesianas para la longitud de las tuberías y el número de fugas; el coste se muestra mediante símbolos proporcionales

El gráfico de dispersión anterior indica que la mayor parte de las inspecciones de las tuberías se realizó en abril.

Crear un gráfico de dispersión

Para crear un gráfico de dispersión, siga estos pasos:

  1. Seleccione dos campos numéricos Campo numérico o de índice/ratio Campo de índice/ratio.
  2. Cree un gráfico de dispersión siguiendo estos pasos:
    1. Arrastre los campos seleccionados a una nueva tarjeta.
    2. Pase el puntero por la zona de colocación del Gráfico.
    3. Suelte los campos seleccionados en el Gráfico de dispersión.
Sugerencia:

También puede crear gráficos usando el menú Gráfico situado encima del panel de datos o el botón Tipo de visualización Tipo de visualización de una tarjeta existente. Para el menú Gráfico, solo se habilitarán los gráficos compatibles con su selección de datos. Para el menú Tipo de visualización, solo se mostrarán visualizaciones compatibles (incluidos mapas, gráficos o tablas).

También se pueden crear gráficos de dispersión usando Ver gráficos de dispersión, al cual se accede desde el botón Acción Acción en Buscar respuestas > ¿Cómo está relacionado?

Notas de uso

De manera predeterminada, los gráficos de dispersión se representan mediante un símbolo único. Puede cambiar el Color del gráfico en el botón LeyendaLeyenda. También puede agregar un campo de cadena de caracteres a la variable Colorear por del eje X para cambiar el gráfico de dispersión a Símbolos únicos. Si se usan símbolos únicos, se pueden seleccionar los datos del gráfico de dispersión mediante la leyenda. Para cambiar el color asociado a una categoría, haga clic en el símbolo y elija un color de la paleta o introduzca un valor hexadecimal.

Para agregar una línea de mejor ajuste al gráfico de dispersión, use el botón Estadísticas de gráfico Estadísticas de gráfico. La línea de mejor ajuste puede ser Lineal, Exponencial o Polinómica. La ecuación de la línea de mejor ajuste y el valor R2 también se mostrarán en el gráfico.

EstadísticaDescripción

Lineal

La regresión lineal trata de ajustar una línea recta a través de un conjunto de valores de forma que las distancias entre los valores y la línea ajustada sea lo más pequeña posible. Una línea con pendiente positiva (de la parte inferior izquierda a la parte superior derecha del gráfico) indica una relación lineal positiva. Las relaciones positivas significan que los valores aumentan juntos. Una línea con pendiente negativa indica una relación lineal negativa. Una relación lineal negativa significa que un valor disminuye cuando otro aumenta. Se pueden usar medidas de la bondad de ajuste, como R2, para cuantificar la relación. Cuanto más cerca de 1, más intensa es la relación.

Exponencial

Calcula una curva exponencial (hacia arriba) del mejor ajuste al modelo; una relación no lineal en sus datos (R2 en 0 o cerca de 0).

Polinómica

Calcula una curva del mejor ajuste de una relación no lineal de sus datos (R2 en 0 o cerca de 0). De manera predeterminada, se utiliza una ecuación polinómica de segundo grado para el cálculo. Puede cambiar la ecuación a una ecuación polinómica de tercer o cuarto grado.

Para agregar una tercera variable numérica o de índice/ratio al diagrama de dispersión, seleccione un campo en el panel de datos y arrástrelo a la tarjeta del gráfico de dispersión existente. Como resultado, se obtendrá un gráfico de dispersión con símbolos proporcionales, en el que el tamaño de los puntos representa la magnitud de los datos de la tercera variable.

Utilice el botón Cambiar campos Invertir para intercambiar las variables de los ejes x e y.

El botón Tipo de visualización Tipo de visualización permite cambiar directamente entre un gráfico de dispersión y una tabla de resumen.

Haga clic en el eje X o Y para cambiar la escala entre Lineal y Logarítmica.