10 ideas que todo profesional debe evitar para la visualización de datos

Nodo de origen: 1194875
ideas a evitar para la imagen de visualización de datos
Créditos de la imagen: Taras Bakusevych

Los datos son el nuevo petróleo, lo hemos escuchado tantas veces. Pero, ¿podemos visualizar esos datos en un formato adecuado? Con la cantidad de datos a nuestra disposición hoy en día, la necesidad de extraer información de ellos es más importante que nunca. Cada día se crean cientos de visualizaciones. Algunos son bien apreciados por la audiencia, mientras que otros simplemente son rechazados. ¿Porque? Bueno, la respuesta está en la creación. Averigüemos la causa y el problema y veamos cómo resolverlos.

Aquí, resumiré algunas de las mejores y peores versiones de los gráficos, para que pueda detener esto si lo está haciendo.

Gráfico inicial con línea de base 0

Uno de los errores más comunes que he descubierto al trazar los gráficos es no comenzar el gráfico con una línea de base 0 y usar algún valor aleatorio.

ideas a evitar para la visualización de datos | 0 línea de base

Utilice el gráfico de barras de trazado correcto

Utilice el gráfico de barras de trazado correcto | ideas a evitar para la visualización de datos

Usualmente usamos gráficos de barras horizontales o verticales en la visualización de datos. A veces, cuando usamos gráficos de barras simples para la comparación, transmite bien el mensaje, pero los gráficos de barras apiladas en vertical o los gráficos de barras apiladas en forma horizontal son mejores. Veamos con un ejemplo.

Ejemplo 1:

Disponemos de datos de Ventas Mensuales de Hembras y Machos. Ambos gráficos muestran la comparación de la Razón de Género para cada cuadrante. Podemos usar la siguiente tabla para la comparación.

Utilice el gráfico de barras de trazado correcto | ideas a evitar para la visualización de datos

Nunca trace valores positivos y negativos en el mismo lado del gráfico o nunca trace características de comparación en el mismo lado del gráfico, ya que se vuelve difícil leer el gráfico.

Múltiples colores en el gráfico

Se deben usar varios colores por una razón en el gráfico. El uso absurdo de los colores en el gráfico es un verdadero desvío al ver los gráficos. En su mayoría, solo se usan 2 colores en los gráficos.

Múltiples colores en el gráfico | ideas a evitar para la visualización de datos

Si tiene más de 2 gráficos, separar los gráficos por colores será una gran idea. Veamos cómo podemos hacer eso.

Múltiples colores en el gráfico | ideas a evitar para la visualización de datos

Como vemos aquí, cada columna tiene su propio propósito, por lo que dar los mismos colores no parecerá interesante, por eso aquí he dado los mismos colores solo a los gráficos que representan el mismo propósito.

Énfasis en los datos

A veces, enfatizar los datos también hace que los gráficos se vean bien. A primera vista, obtendremos que el C Valor es más alto entre todas las otras características que utilizamos.

Aquí solo tenemos 4 funciones, por lo que este pequeño cambio en el gráfico no será tan efectivo, pero cuando estamos trabajando con 100 funciones, resaltar el valor más alto de la función nos ayudará mucho. Tener 100 características y trazarlas es una tarea difícil, pero en ese momento podemos pasar una condición en la que supongamos que las 10 características principales se resaltarán con color gris y otras tendrán color rosa.

Confusa elección de colores.

Fuentes, colores, ejes, todas estas características tienen importancia al trazar los gráficos. Elegir los colores para los gráficos es un paso crucial porque si tiene colores muy brillantes o muy claros en los gráficos, será difícil leer los gráficos.

En el ejemplo, tenemos 2 gráficos diferentes que muestran las ventas más altas a las más bajas en la región diferenciadas en los colores. Si vemos el gráfico del lado izquierdo, los diferentes tonos de amarillo no son visibles a simple vista. En el lado derecho tenemos la escala de colores de azul y rosa donde podemos diferenciar fácilmente las tonalidades.

Confusa elección de colores.

Evite la aleatoriedad en los gráficos

Tener siempre las barras en orden ascendente o descendente según sus valores. Coloque el valor más grande en la parte superior para los gráficos de barras horizontales y coloque los valores más grandes a la izquierda para los gráficos de barras verticales. Esto ayudará a la audiencia a ubicar el valor más alto y más bajo de los gráficos.

Evite la aleatoriedad en los gráficos

Contar una historia o al menos responder una pregunta.

La mayoría de los visualizadores de datos iniciales solo crean gráficos únicos como histogramas o barras. a veces, combinar 2 gráficos también ayuda. Veamos cómo se hace.

Puede encontrar los datos en el Kaggle y Notebook. Así que aquí hice gráficos para el análisis de las ventas promedio de productos, tiendas y grupos. Puede hacer diferentes gráficos, como circulares y de barras, pero los he combinado todos en uno para obtener una descripción general del análisis. Aquí podemos decir claramente que la tienda A tiene las ventas más altas y los productos que se compran con frecuencia son comestibles y bebidas.

Contar una historia o al menos responder una pregunta.
1 imagen

Agregar contexto según sea necesario

Si cree que agregar texto adicional ayudará al lector a comprender mejor el gráfico, solo agregue el texto. Veamos con el ejemplo real. Puedes encontrar este gráfico en Kaggle

El gráfico nos informa sobre qué programas de televisión o películas tienen la calificación más alta en Netflix. Aquí agregué texto como que al 97% de la audiencia le gustan las películas en lugar de los programas de televisión. Entonces, cuando una audiencia lea el gráfico, sabrá que la audiencia prefiere películas en lugar de programas de televisión y podrá comparar la calificación entre los programas.

Agregar contexto según sea necesario

Destacando algunas características como cambiar el color de la barra que tiene el valor más alto. Aquí, como estamos hablando de Netflix, he elegido el color rojo y negro para el gráfico en lugar del simple color blanco.

Trabajar con un gráfico circular

He visto a muchas personas usar gráficos circulares de manera incorrecta.

Puntos para recordar al trabajar con gráficos circulares

  • Nunca tenga más de 5 valores en el gráfico circular
  • Siempre dé una etiqueta adecuada, no importa cuán bien haya representado el gráfico, no importará. Etiquetar directamente en el gráfico es muy útil ya que la audiencia no tiene que buscar las leyendas. Encontrar las leyendas requiere tiempo y no queremos que nuestra audiencia pierda tiempo en esto.

En el ejemplo vemos la proporción de programas vistos en Netflix. Podemos ver claramente que las películas son más preferidas aquí.

Trabajar con un gráfico circular

Elegir la paleta de colores

Categórico datos, un Cualitativo paleta de colores funciona mejor para la pantalla. Los colores asignados deben distinguirse fácilmente para garantizar la accesibilidad.

Numérico datos, un Secuencial paleta de colores funciona mejor para la pantalla. Porque los datos numéricos deben colocarse en un orden específico (ascendente, descendente).

A divergente La paleta de colores es una combinación de 2 paletas secuenciales que tienen un valor central en el medio, generalmente cero.

La imagen de abajo se toma como referencia de color de Plotly.

Elegir la paleta de colores
2 imagen

Notas finales

Vimos algunos de los errores comunes en los gráficos y cómo superarlos con algunos ejemplos. Si tienes alguna consulta puedes contactarme por cualquiera de estos medios.

La visualización de datos es una forma de arte que debe dominarse con el tiempo. Estos consejos y técnicas de visualización de datos, aunque no son completos, seguramente lo ayudarán a avanzar en el camino correcto. Recuerde siempre que hacemos gráficos o imágenes, no para que entendamos, hacemos estos gráficos para que la audiencia pueda entender sin entrar en aspectos técnicos. Comprender la perspectiva de la audiencia es la clave para crear imágenes exitosas y efectivas.

No importa qué herramienta haya utilizado para crear gráficos elegantes y bien educados, es importante que entreguemos la esencia detrás de las imágenes.

Etiqueta LinkedIn | Kaggle | Medio | Analítica Vidhya

Fuente de la imagen

  1. Imagen 1: https://www.kaggle.com/kashishrastogi/store-sales-forecasting
  2. Imagen 2: https://plotly.com/python/builtin-colorscales/

Fuente: https://www.analyticsvidhya.com/blog/2021/10/10-ideas-that-every-professional-should-avoid-for-data-visualization/

Sello de tiempo:

Mas de Analítica Vidhya