10 ιδέες που πρέπει να αποφεύγει κάθε Επαγγελματίας για την Οπτικοποίηση Δεδομένων

Κόμβος πηγής: 1194875
ιδέες που πρέπει να αποφύγετε για την εικόνα Οπτικοποίησης δεδομένων
Πηγές εικόνας: Taras Bakusevych

Τα δεδομένα είναι το νέο λάδι που το έχουμε ακούσει τόσες φορές. Μπορούμε όμως να οπτικοποιήσουμε αυτά τα δεδομένα σε σωστή μορφή; Με τον όγκο των δεδομένων που έχουμε σήμερα στη διάθεσή μας, η ανάγκη εξαγωγής πληροφοριών από αυτά είναι πιο σημαντική από ποτέ. Εκατοντάδες απεικονίσεις δημιουργούνται κάθε μέρα. Κάποιοι εκτιμώνται καλά από το κοινό ενώ άλλοι απλώς απορρίπτονται. Γιατί έτσι? Λοιπόν, η απάντηση βρίσκεται στη δημιουργία. Ας μάθουμε την αιτία και το πρόβλημα και ας δούμε πώς να τα λύσουμε.

Εδώ, θα συνοψίσω μερικές από τις καλύτερες και χειρότερες εκδόσεις των τσαρτ, ώστε να μπορείτε να το σταματήσετε αν το κάνετε.

Αρχικό γράφημα με 0 γραμμή βάσης

Ένα από τα πιο συνηθισμένα λάθη που έχω ανακαλύψει κατά τη σχεδίαση των γραφημάτων είναι ότι δεν ξεκινάω το γράφημα με γραμμή βάσης 0 και χρησιμοποιώ κάποια τυχαία τιμή.

ιδέες που πρέπει να αποφύγετε για την Οπτικοποίηση Δεδομένων | 0 γραμμή βάσης

Χρησιμοποιήστε το σωστό γράφημα ράβδων

Χρησιμοποιήστε το σωστό γράφημα ράβδων | ιδέες που πρέπει να αποφύγετε για την Οπτικοποίηση Δεδομένων

Συνήθως χρησιμοποιούσαμε οριζόντιες ή κάθετες ραβδώσεις στην οπτικοποίηση δεδομένων. Μερικές φορές, όταν χρησιμοποιούμε απλά γραφήματα ράβδων για τη σύγκριση, μεταφέρει καλά το μήνυμα, αλλά τα γραφήματα ράβδων στοιβαγμένων σε κατακόρυφες ή σε στοιβαγμένα γραφήματα ράβδων με οριζόντιο τρόπο είναι καλύτερα. Ας δούμε με ένα παράδειγμα.

Παράδειγμα 1:

Έχουμε στοιχεία μηνιαίων πωλήσεων για γυναίκες και άνδρες. Και τα δύο γραφήματα δείχνουν τη σύγκριση για την αναλογία φύλου για κάθε τεταρτημόριο. Μπορούμε να χρησιμοποιήσουμε το παρακάτω διάγραμμα για τη σύγκριση.

Χρησιμοποιήστε το σωστό γράφημα ράβδων | ιδέες που πρέπει να αποφύγετε για την Οπτικοποίηση Δεδομένων

Ποτέ μην σχεδιάζετε θετικές και αρνητικές τιμές στην ίδια πλευρά του γραφήματος ή μην σχεδιάζετε ποτέ τα χαρακτηριστικά σύγκρισης στην ίδια πλευρά του γραφήματος, καθίσταται δύσκολη η ανάγνωση του γραφήματος.

Πολλαπλά χρώματα στο διάγραμμα

Θα πρέπει να χρησιμοποιούνται πολλά χρώματα για κάποιο λόγο στο γράφημα. Η παράλογη χρήση των χρωμάτων στο γράφημα είναι μια πραγματική απόκλιση κατά την προβολή των γραφημάτων. Χρησιμοποιούνται κυρίως μόνο 2 χρώματα στα διαγράμματα.

Πολλαπλά χρώματα στο γράφημα | ιδέες που πρέπει να αποφύγετε για την Οπτικοποίηση Δεδομένων

Εάν έχετε περισσότερα από 2 γραφήματα, τότε ο διαχωρισμός των γραφημάτων θα είναι μια εξαιρετική ιδέα με βάση τα χρώματα. Ας δούμε πώς μπορούμε να το κάνουμε αυτό.

Πολλαπλά χρώματα στο γράφημα | ιδέες που πρέπει να αποφύγετε για την Οπτικοποίηση Δεδομένων

Όπως βλέπουμε εδώ, κάθε στήλη έχει το δικό της σκοπό, οπότε το να δίνετε τα ίδια χρώματα δεν θα φαίνεται ενδιαφέρον, γι' αυτό εδώ έδωσα τα ίδια χρώματα μόνο σε γραφήματα που αντιπροσωπεύουν τον ίδιο σκοπό.

Έμφαση στα Δεδομένα

Μερικές φορές η έμφαση στα δεδομένα κάνει τα γραφήματα να φαίνονται ωραία. Με την πρώτη ματιά, θα καταλάβουμε ότι το C η τιμή είναι υψηλότερο μεταξύ όλων των άλλων χαρακτηριστικών που χρησιμοποιήσαμε.

Εδώ έχουμε μόνο 4 χαρακτηριστικά, επομένως αυτή η μικρή αλλαγή στο γράφημα δεν θα είναι τόσο αποτελεσματική, αλλά όταν εργαζόμαστε με 100 χαρακτηριστικά, τότε η επισήμανση της υψηλότερης αξίας της δυνατότητας θα μας βοηθήσει πολύ. Το να έχουμε 100 χαρακτηριστικά και να τα σχεδιάσουμε είναι ένα δύσκολο έργο, αλλά εκείνη τη στιγμή μπορούμε να περάσουμε μια συνθήκη όπου ας υποθέσουμε ότι τα κορυφαία 10 χαρακτηριστικά θα τονιστούν με γκρι χρώμα και άλλα θα έχουν ροζ χρώμα.

Μπερδεμένη επιλογή χρωμάτων

Γραμματοσειρές, χρώματα, άξονες όλα αυτά τα χαρακτηριστικά έχουν σημασία κατά τη σχεδίαση των γραφημάτων. Η επιλογή των χρωμάτων για τα γραφήματα είναι ένα πολύ κρίσιμο βήμα γιατί αν έχετε πολύ φωτεινά ή πολύ ανοιχτά χρώματα στα γραφήματα, τότε θα γίνει δύσκολο να διαβάσετε τα γραφήματα.

Στο παράδειγμα, έχουμε 2 διαφορετικά γραφήματα που δείχνουν τις υψηλότερες έως τις χαμηλότερες πωλήσεις στην περιοχή που διαφοροποιούνται στα χρώματα. Αν δούμε το γράφημα στην αριστερή πλευρά, διαφορετικές αποχρώσεις του κίτρινου δεν είναι ορατές με γυμνό μάτι. Στη δεξιά πλευρά, έχουμε τη χρωματική κλίμακα του μπλε και του ροζ όπου μπορούμε εύκολα να διαφοροποιήσουμε τις αποχρώσεις.

Μπερδεμένη επιλογή χρωμάτων

Αποφύγετε την τυχαιότητα στα γραφήματα

Έχετε πάντα τις ράβδους σε αύξουσα ή φθίνουσα σειρά σύμφωνα με τις τιμές τους. Τοποθετήστε τη μεγαλύτερη τιμή στο επάνω μέρος για γραφήματα οριζόντιων ράβδων και τοποθετήστε τις μεγαλύτερες τιμές στα αριστερά για γραφήματα κάθετων ράβδων. Αυτό θα βοηθήσει το κοινό να εντοπίσει την υψηλότερη και τη χαμηλότερη τιμή από τα γραφήματα.

Αποφύγετε την τυχαιότητα στα γραφήματα

Πείτε μια ιστορία ή απαντήστε τουλάχιστον σε μια ερώτηση

Οι περισσότεροι από τους αρχικούς οπτικοποιητές δεδομένων δημιουργούν μόνο μεμονωμένα γραφήματα, όπως ιστογράμματα ή ράβδους. Μερικές φορές ο συνδυασμός 2 διαγραμμάτων βοηθά επίσης. Ας δούμε πώς γίνεται.

Μπορείτε να βρείτε τα δεδομένα στο Kaggle και σημειωματάριο. Εδώ λοιπόν έχω φτιάξει γραφήματα για την ανάλυση των μέσων πωλήσεων προϊόντων, καταστημάτων και συμπλεγμάτων. Μπορείτε να φτιάξετε διαφορετικά γραφήματα όπως πίτα και μπάρα, αλλά τα συνδύασα όλα σε ένα για μια επισκόπηση της ανάλυσης. Εδώ μπορούμε να πούμε ξεκάθαρα ότι το Κατάστημα Α έχει τις υψηλότερες πωλήσεις και τα προϊόντα που αγοράζονται συχνά είναι τα παντοπωλεία και τα ποτά.

Πείτε μια ιστορία ή απαντήστε τουλάχιστον σε μια ερώτηση
1 εικόνα

Προσθήκη περιβάλλοντος όπως απαιτείται

Εάν πιστεύετε ότι η προσθήκη επιπλέον κειμένου θα βοηθήσει τον αναγνώστη να κατανοήσει καλύτερα το γράφημα, τότε προσθέστε μόνο το κείμενο. Ας δούμε με το πραγματικό παράδειγμα. Μπορείτε να βρείτε αυτό το γράφημα στο Kaggle

Το γράφημα μας λέει για το ποιες τηλεοπτικές εκπομπές ή ταινίες στο Netflix έχουν την υψηλότερη βαθμολογία. Εδώ έχω προσθέσει κάποιο κείμενο όπως το 97% του κοινού αρέσει σε Ταινίες και όχι σε τηλεοπτικές εκπομπές. Έτσι, όταν ένα κοινό διαβάζει το γράφημα θα γνωρίζει ότι το κοινό προτιμά ταινίες παρά τηλεοπτικές εκπομπές και μπορεί να συγκρίνει τη βαθμολογία μεταξύ των εκπομπών.

Προσθήκη περιβάλλοντος όπως απαιτείται

Επισήμανση ορισμένων χαρακτηριστικών, όπως η αλλαγή του χρώματος της γραμμής που έχει την υψηλότερη τιμή. Εδώ, καθώς μιλάμε για το Netflix, επέλεξα το κόκκινο και το μαύρο χρώμα για το γράφημα παρά το απλό λευκό χρώμα.

Εργασία με ένα γράφημα πίτας

Έχω δει πολλούς ανθρώπους να χρησιμοποιούν γραφήματα πίτας με λάθος τρόπο.

Σημεία που πρέπει να θυμάστε κατά την εργασία με το γράφημα πίτας

  • Ποτέ μην έχετε περισσότερες από 5 τιμές στο γράφημα πίτας
  • Πάντα να δίνετε μια σωστή ετικέτα, ανεξάρτητα από το πόσο όμορφα αναπαριστάσατε το γράφημα, δεν θα έχει σημασία. Η τοποθέτηση ετικετών απευθείας στο γράφημα είναι εξαιρετικά χρήσιμη, καθώς το κοινό δεν χρειάζεται να αναζητήσει τους θρύλους. Η εύρεση των θρύλων απαιτεί χρόνο και δεν θέλουμε το κοινό μας να χάνει χρόνο σε αυτό.

Στο παράδειγμα, όπως βλέπουμε την αναλογία των εκπομπών που παρακολουθούνται στο Netflix. Μπορούμε να δούμε ξεκάθαρα ότι εδώ προτιμώνται περισσότερο οι ταινίες.

Εργασία με ένα γράφημα πίτας

Επιλογή της παλέτας χρωμάτων

Για Κατηγορηματικός δεδομένα, α Ποιοτικός Η παλέτα χρωμάτων λειτουργεί καλύτερα για την οθόνη. Τα χρώματα που εκχωρούνται πρέπει να είναι εύκολα διακριτά για να διασφαλίζεται η προσβασιμότητα.

Για Αριθμητικός δεδομένα, α Διαδοχική Η παλέτα χρωμάτων λειτουργεί καλύτερα για την οθόνη. Επειδή τα αριθμητικά δεδομένα πρέπει να τοποθετηθούν με συγκεκριμένη σειρά (αύξουσα, φθίνουσα).

A αποκλίνουσες Η παλέτα χρωμάτων είναι ένας συνδυασμός 2 διαδοχικών παλετών με κεντρική τιμή στη μέση συνήθως μηδέν.

Η παρακάτω εικόνα έχει ληφθεί για αναφορά χρώματος από το Plotly.

Επιλογή της παλέτας χρωμάτων
2 εικόνα

Τέλειες σημειώσεις

Είδαμε μερικά από τα κοινά λάθη στα γραφήματα και πώς να τα ξεπεράσουμε με μερικά παραδείγματα. Εάν έχετε οποιεσδήποτε απορίες, μπορείτε να επικοινωνήσετε μαζί μου σε οποιοδήποτε από αυτά τα μέσα.

Η οπτικοποίηση δεδομένων είναι μια μορφή τέχνης που πρέπει να κατακτηθεί με την πάροδο του χρόνου. Αυτές οι συμβουλές και τεχνικές οπτικοποίησης δεδομένων, αν και δεν είναι ολοκληρωμένες, αλλά σίγουρα θα σας βοηθήσουν να προχωρήσετε στον σωστό δρόμο. Να θυμάστε πάντα ότι φτιάχνουμε γραφήματα ή γραφικά, όχι για την κατανόησή μας, κάνουμε αυτά τα τσαρτ, ώστε το κοινό να μπορεί να καταλάβει χωρίς να μπει σε τεχνικά θέματα. Η κατανόηση της οπτικής γωνίας του κοινού είναι το κλειδί για τη δημιουργία επιτυχημένων και αποτελεσματικών εικαστικών.

Δεν έχει σημασία ποιο εργαλείο χρησιμοποιήσατε για να δημιουργήσετε κομψά και καλοδιατηρημένα γραφήματα, είναι σημαντικό ότι παραδώσαμε την ουσία πίσω από τα γραφικά.

LinkedIn | Kaggle | Μέτριας Δυσκολίας | Ανάλυση Vidhya

Πηγή εικόνας

  1. Εικόνα 1: https://www.kaggle.com/kashishrastogi/store-sales-forecasting
  2. Εικόνα 2 – https://plotly.com/python/builtin-colorscales/

Πηγή: https://www.analyticsvidhya.com/blog/2021/10/10-ideas-that-every-professional-should-avoid-for-data-visualization/

Σφραγίδα ώρας:

Περισσότερα από Ανάλυση Vidhya