10 idées que tout professionnel devrait éviter pour la visualisation de données

Nœud source: 1194875
idées à éviter pour l'image Data Visualization
Crédits image : Taras Bakusevych

Les données sont le nouveau pétrole que nous avons entendu tant de fois. Mais pouvons-nous visualiser ces données dans un format approprié ? Avec la quantité de données dont nous disposons aujourd'hui, la nécessité d'en extraire des informations est plus importante que jamais. Des centaines de visualisations sont créées chaque jour. Certains sont bien appréciés par le public tandis que d'autres sont simplement rejetés. Pourquoi donc ? Eh bien, la réponse réside dans la création. Cherchons la cause et le problème et voyons comment les résoudre.

Ici, je vais résumer certaines des meilleures et des pires versions des graphiques, vous pouvez donc arrêter cela si vous le faites.

Graphique de départ avec une ligne de base 0

L'une des erreurs les plus courantes que j'ai découvertes lors du traçage des graphiques est de ne pas commencer le graphique avec une ligne de base 0 et d'utiliser une valeur aléatoire.

idées à éviter pour la visualisation de données | 0 ligne de base

Utiliser le bon graphique à barres de traçage

Utilisez le graphique à barres de traçage approprié | idées à éviter pour la visualisation des données

Nous avons couramment utilisé des graphiques à barres horizontales ou verticales dans la visualisation de données. Parfois, lorsque nous utilisons des graphiques à barres simples pour la comparaison, cela transmet bien le message, mais des graphiques à barres empilées verticalement ou des graphiques à barres empilées de manière horizontale sont préférables. Voyons avec un exemple.

1 Exemple:

Nous avons des données sur les ventes mensuelles pour les femmes et les hommes. Les deux graphiques montrent la comparaison du rapport entre les sexes pour chaque quadrant. Nous pouvons utiliser le tableau ci-dessous pour la comparaison.

Utilisez le graphique à barres de traçage approprié | idées à éviter pour la visualisation des données

Ne tracez jamais les valeurs positives et négatives du même côté du graphique ou ne tracez jamais les caractéristiques de comparaison du même côté du graphique, il devient difficile de lire le graphique.

Plusieurs couleurs sur le graphique

Plusieurs couleurs doivent être utilisées pour une raison dans le graphique. L'utilisation absurde des couleurs dans le graphique est un véritable désagrément en voyant les graphiques. Généralement utilisé seulement 2 couleurs dans les graphiques.

Plusieurs couleurs sur le graphique | idées à éviter pour la visualisation des données

Si vous avez plus de 2 graphiques, séparer les graphiques par couleurs sera une excellente idée. Voyons comment nous pouvons le faire.

Plusieurs couleurs sur le graphique | idées à éviter pour la visualisation des données

Comme nous le voyons ici, chaque colonne a son propre objectif, donc donner les mêmes couleurs ne semblera pas intéressant, c'est pourquoi ici, j'ai donné les mêmes couleurs uniquement aux graphiques représentant le même objectif.

Accent sur les données

Parfois, l'accentuation des données donne également une belle apparence aux graphiques. Au premier coup d'œil, on comprendra que le C valeur est augmentation parmi toutes les autres fonctionnalités que nous avons utilisées.

Ici, nous n'avons que 4 fonctionnalités, donc ce petit changement dans le graphique ne sera pas si efficace, mais lorsque nous travaillons avec 100 fonctionnalités, la mise en évidence de la valeur la plus élevée de la fonctionnalité nous aidera beaucoup. Avoir 100 caractéristiques et les tracer est une tâche difficile, mais à ce moment-là, nous pouvons passer une condition où supposons que les 10 principales caractéristiques seront mises en évidence avec une couleur grise et que d'autres auront une couleur rose.

Choix de couleurs déroutant

Polices, couleurs, axes, toutes ces caractéristiques ont de l'importance lors du traçage des graphiques. Le choix des couleurs pour les graphiques est une étape très cruciale car si vous avez des couleurs très vives ou très claires sur les graphiques, il deviendra alors difficile de lire les graphiques.

Dans l'exemple, nous avons 2 graphiques différents montrant les ventes les plus élevées aux plus basses dans la région se différencient par les couleurs. Si nous voyons le graphique sur le côté gauche, différentes nuances de jaune ne sont pas visibles à l'œil nu. Sur le côté droit, nous avons l'échelle de couleurs du bleu et du rose où nous pouvons facilement différencier les nuances.

Choix de couleurs déroutant

Éviter le hasard sur les graphiques

Ayez toujours les barres dans l'ordre croissant ou décroissant selon leurs valeurs. Placez la plus grande valeur en haut pour les graphiques à barres horizontales et placez les plus grandes valeurs à gauche pour les graphiques à barres verticales. Cela aidera le public à localiser la valeur la plus élevée et la plus basse des graphiques.

Éviter le hasard sur les graphiques

Raconter une histoire ou au moins répondre à une question

La plupart des visualiseurs de données de démarrage ne créent que des graphiques uniques tels que des histogrammes ou des barres. Parfois, la combinaison de 2 graphiques aide également. Voyons comment c'est fait.

Vous pouvez trouver les données sur le Kaggle ainsi que le Cahier . J'ai donc créé ici des graphiques pour l'analyse des ventes moyennes de produits, de magasins et de clusters. Vous pouvez créer différents graphiques tels que des graphiques à secteurs et à barres, mais je les ai tous combinés en un seul pour un aperçu de l'analyse. Ici, nous pouvons clairement dire que le magasin A a les ventes les plus élevées et que les produits fréquemment achetés sont l'épicerie et les boissons.

Raconter une histoire ou au moins répondre à une question
image 1

Ajout de contexte au besoin

Si vous pensez que l'ajout de texte supplémentaire aidera le lecteur à mieux comprendre le tableau, n'ajoutez que le texte. Voyons avec l'exemple réel. Vous pouvez trouver ce tableau sur Kaggle

Le graphique nous indique quelles émissions de télévision ou films sont les mieux notés sur Netflix. Ici, j'ai ajouté du texte comme 97% du public aime les films plutôt que les émissions de télévision. Ainsi, lorsqu'un public lira le tableau, il saura que le public préfère les films plutôt que les émissions de télévision et il pourra comparer les notes entre les émissions.

Ajout de contexte au besoin

Mise en évidence de certaines fonctionnalités comme la modification de la couleur de la barre qui a la valeur la plus élevée. Ici, comme nous parlons de Netflix, j'ai donc choisi la couleur rouge et noire pour le graphique plutôt que la simple couleur blanche.

Travailler avec un camembert

J'ai vu beaucoup de gens utiliser des camemberts de la mauvaise manière.

Points à retenir lorsque vous travaillez avec un graphique à secteurs

  • Ne jamais avoir plus de 5 valeurs dans le camembert
  • Donnez toujours une étiquette appropriée, peu importe à quel point vous avez bien représenté le graphique, cela n'aura pas d'importance. L'étiquetage directement sur le graphique est super utile car le public n'a pas à chercher les légendes. Trouver les légendes prend du temps et nous ne voulons pas que notre public perde son temps là-dessus.

Dans l'exemple, nous voyons le ratio d'émissions regardées sur Netflix. Nous pouvons clairement voir que les films sont plus préférés ici.

Travailler avec un camembert

Choisir la palette de couleurs

Pour Catégorique des données, un Qualitative palette de couleurs qui fonctionne le mieux pour l'affichage. Les couleurs attribuées doivent être facilement distinctes pour assurer l'accessibilité.

Pour Numérique des données, un Séquentiel palette de couleurs qui fonctionne le mieux pour l'affichage. Parce que les données numériques doivent être placées dans un ordre spécifique (croissant, décroissant).

A divergent palette de couleurs est une combinaison de 2 palettes séquentielles ayant une valeur centrale au milieu généralement zéro.

L'image ci-dessous est prise pour référence de couleur à partir de Plotly.

Choisir la palette de couleurs
image 2

Notes de fin

Nous avons vu certaines des erreurs courantes dans les graphiques et comment les surmonter avec quelques exemples. Si vous avez des questions, vous pouvez me contacter sur l'un de ces médias.

La visualisation de données est une forme d'art qui doit être maîtrisée au fil du temps. Ces conseils et techniques de visualisation de données, bien que non exhaustifs, vous aideront sûrement à avancer sur la bonne voie. Rappelez-vous toujours que nous créons des graphiques ou des visuels, pas pour notre compréhension, nous créons ces graphiques afin que le public puisse comprendre sans entrer dans des détails techniques. Comprendre le point de vue du public est la clé pour créer des visuels réussis et efficaces.

Quel que soit l'outil que vous avez utilisé pour créer des graphiques élégants et soignés, il est important que nous fournissions l'essence même des visuels.

LinkedIn | Kaggle | Moyenne | Analytique Vidhya

Image Source

  1. Image 1 : https://www.kaggle.com/kashishrastogi/store-sales-forecasting
  2. Image 2 – https://plotly.com/python/builtin-colorscales/

Source : https://www.analyticsvidhya.com/blog/2021/10/10-ideas-that-every-professional-should-avoid-for-data-visualization/

Horodatage:

Plus de Analytique Vidhya