डेटा विज़ुअलाइज़ेशन के लिए 10 विचार जिनसे हर पेशेवर को बचना चाहिए

स्रोत नोड: 1194875
डेटा विज़ुअलाइज़ेशन छवि से बचने के लिए उपाय
छवि क्रेडिट: तारास बाकुसेविच

डेटा नया तेल है यह हमने कई बार सुना है। लेकिन क्या हम उस डेटा को उचित प्रारूप में देख सकते हैं? आज हमारे निपटान में डेटा की मात्रा के साथ, इससे अंतर्दृष्टि निकालने की आवश्यकता पहले से कहीं अधिक महत्वपूर्ण है। हर दिन सैकड़ों विज़ुअलाइज़ेशन बनाए जाते हैं। कुछ को दर्शकों द्वारा अच्छी तरह से सराहा जाता है जबकि अन्य को सिर्फ खारिज कर दिया जाता है। ऐसा किस लिए? खैर, उत्तर सृजन में निहित है। आइए कारण और समस्या का पता लगाएं और देखें कि उन्हें कैसे हल किया जाए।

यहां, मैं चार्ट के कुछ सबसे अच्छे और सबसे खराब संस्करणों का सारांश दूंगा, इसलिए यदि आप इसे कर रहे हैं तो आप इसे रोक सकते हैं।

0 बेसलाइन के साथ शुरुआती चार्ट

चार्ट को प्लॉट करते समय मैंने जो सबसे आम गलतियाँ की हैं, उनमें से एक चार्ट को 0 बेसलाइन के साथ शुरू नहीं करना और कुछ यादृच्छिक मान का उपयोग करना है।

डेटा विज़ुअलाइज़ेशन से बचने के उपाय | 0 आधार रेखा

सही प्लॉटिंग बार चार्ट का उपयोग करें

सही प्लॉटिंग बार चार्ट का प्रयोग करें डेटा विज़ुअलाइज़ेशन से बचने के लिए विचार

हम आमतौर पर डेटा विज़ुअलाइज़ेशन में क्षैतिज या लंबवत बार चार्ट का उपयोग करते हैं। कभी-कभी जब हम तुलना के लिए सरल बार चार्ट का उपयोग करते हैं तो यह संदेश को अच्छी तरह से व्यक्त करता है लेकिन लंबवत बार चार्ट या क्षैतिज तरीके से स्टैक्ड बार चार्ट बेहतर होता है। एक उदाहरण के साथ देखते हैं।

उदाहरण 1:

हमारे पास महिलाओं और पुरुषों की मासिक बिक्री के आंकड़े हैं। दोनों चार्ट हर चतुर्थांश के लिए लिंग अनुपात की तुलना दिखाते हैं। हम तुलना के लिए नीचे दिए गए चार्ट का उपयोग कर सकते हैं।

सही प्लॉटिंग बार चार्ट का प्रयोग करें डेटा विज़ुअलाइज़ेशन से बचने के लिए विचार

चार्ट के एक ही तरफ कभी भी सकारात्मक और नकारात्मक मूल्यों को प्लॉट न करें या चार्ट के एक ही तरफ सुविधाओं की तुलना करने के लिए प्लॉट न करें, चार्ट को पढ़ना मुश्किल हो जाता है।

चार्ट पर एकाधिक रंग

चार्ट में एक कारण के लिए एकाधिक रंगों का उपयोग किया जाना चाहिए। चार्ट में रंगों का बेतुका उपयोग चार्ट को देखते समय एक वास्तविक टर्न-ऑफ है। अधिकतर चार्ट में केवल 2 रंगों का उपयोग किया जाता है।

चार्ट पर एकाधिक रंग | डेटा विज़ुअलाइज़ेशन से बचने के लिए विचार

यदि आपके पास 2 से अधिक चार्ट हैं तो चार्ट को रंगों से अलग करना एक अच्छा विचार होगा। आइए देखें कि हम ऐसा कैसे कर सकते हैं।

चार्ट पर एकाधिक रंग | डेटा विज़ुअलाइज़ेशन से बचने के लिए विचार

जैसा कि हम यहां देखते हैं कि प्रत्येक कॉलम का अपना उद्देश्य होता है, इसलिए समान रंग देना दिलचस्प नहीं लगेगा, इसलिए यहां मैंने समान उद्देश्य का प्रतिनिधित्व करने वाले चार्ट को समान रंग दिए हैं।

डेटा पर जोर

कभी-कभी डेटा पर जोर देने से भी चार्ट अच्छे लगते हैं। पहली नज़र में, हम पाएंगे कि C मूल्य है उच्चतर हमारे द्वारा उपयोग की जाने वाली अन्य सभी सुविधाओं में से।

यहां हमारे पास केवल 4 विशेषताएं हैं इसलिए चार्ट में यह छोटा सा बदलाव उतना प्रभावी नहीं होगा लेकिन जब हम 100 सुविधाओं के साथ काम कर रहे हैं तो फीचर के उच्चतम मूल्य को उजागर करने से हमें बहुत मदद मिलेगी। 100 फीचर का होना और उन्हें प्लॉट करना एक मुश्किल काम है लेकिन उस समय हम एक कंडीशन पास कर सकते हैं जहां मान लें कि टॉप 10 फीचर्स ग्रे कलर से हाइलाइट होंगे और अन्य में पिंक कलर होगा।

रंगों का भ्रमित करने वाला विकल्प

चार्ट बनाते समय फोंट, रंग, अक्ष इन सभी विशेषताओं को महत्व देते हैं। चार्ट के लिए रंगों का चयन करना एक बहुत ही महत्वपूर्ण कदम है क्योंकि यदि आपके चार्ट पर बहुत चमकीले या बहुत हल्के रंग हैं तो चार्ट को पढ़ना मुश्किल हो जाएगा।

उदाहरण में, हमारे पास 2 अलग-अलग चार्ट हैं जो रंगों पर अंतर करते हुए क्षेत्र में उच्चतम से निम्नतम बिक्री दिखाते हैं। यदि हम चार्ट को बाईं ओर देखते हैं तो पीले रंग के विभिन्न रंगों को नग्न आंखों से नहीं देखा जा सकता है। दाईं ओर, हमारे पास नीले और गुलाबी रंग का पैमाना है जहां हम रंगों को आसानी से अलग कर सकते हैं।

रंगों का भ्रमित करने वाला विकल्प

चार्ट पर यादृच्छिकता से बचें

सलाखों को हमेशा उनके मूल्यों के अनुसार आरोही या अवरोही क्रम में रखें। क्षैतिज बार चार्ट के लिए शीर्ष पर सबसे बड़ा मान रखें और लंबवत बार चार्ट के लिए बाईं ओर सबसे बड़ा मान रखें। इससे दर्शकों को चार्ट से उच्चतम और निम्नतम मूल्य का पता लगाने में मदद मिलेगी।

चार्ट पर यादृच्छिकता से बचें

एक कहानी बताओ या कम से कम एक प्रश्न का उत्तर दो

अधिकांश स्टार्टर डेटा विज़ुअलाइज़र हिस्टोग्राम या बार जैसे केवल एकल चार्ट बनाते हैं। कभी-कभी 2 चार्टों के संयोजन से भी मदद मिलती है। आइए देखें कि यह कैसे किया जाता है।

आप पर डेटा पा सकते हैं Kaggle और नोटबुक. इसलिए यहां मैंने उत्पादों, दुकानों और क्लस्टरों की औसत बिक्री के विश्लेषण के लिए चार्ट बनाए हैं। आप पाई और बार जैसे अलग-अलग चार्ट बना सकते हैं लेकिन विश्लेषण के अवलोकन के लिए मैंने उन सभी को एक साथ जोड़ दिया है। यहाँ हम स्पष्ट रूप से बता सकते हैं कि स्टोर ए में सबसे अधिक बिक्री होती है और जो उत्पाद अक्सर खरीदे जाते हैं वे किराना और पेय पदार्थ होते हैं।

एक कहानी बताओ या कम से कम एक प्रश्न का उत्तर दो
छवि 1

आवश्यकतानुसार संदर्भ जोड़ना

अगर आपको लगता है कि अतिरिक्त टेक्स्ट जोड़ने से पाठक को चार्ट को बेहतर ढंग से समझने में मदद मिलेगी, तभी टेक्स्ट जोड़ें। असली उदाहरण से देखते हैं। आप इस चार्ट को पर पा सकते हैं Kaggle

चार्ट हमें बताता है कि नेटफ्लिक्स पर किस टीवी शो या मूवी की रेटिंग सबसे ज्यादा है। यहां मैंने कुछ पाठ जोड़े हैं जैसे 97% दर्शक टीवी शो के बजाय मूवी पसंद करते हैं। इसलिए जब दर्शक चार्ट को पढ़ेंगे तो उन्हें पता चल जाएगा कि दर्शक टीवी शो के बजाय फिल्में पसंद करते हैं और वे शो के बीच रेटिंग की तुलना कर सकते हैं।

आवश्यकतानुसार संदर्भ जोड़ना

कुछ विशेषताओं को हाइलाइट करना जैसे बार का रंग बदलना जिसका मूल्य सबसे अधिक है। यहां जैसा कि हम नेटफ्लिक्स के बारे में बात कर रहे हैं, इसलिए मैंने चार्ट के लिए साधारण सफेद रंग के बजाय लाल और काले रंग को चुना है।

पाई चार्ट के साथ काम करना

मैंने कई लोगों को पाई चार्ट का गलत तरीके से इस्तेमाल करते देखा है।

पाई चार्ट के साथ काम करते समय याद रखने योग्य बातें

  • पाई चार्ट में कभी भी 5 से अधिक मान न रखें
  • हमेशा एक उचित लेबल दें, इससे कोई फर्क नहीं पड़ता कि आपने कितनी अच्छी तरह से चार्ट का प्रतिनिधित्व किया है। चार्ट पर सीधे लेबल लगाना अत्यंत उपयोगी है क्योंकि दर्शकों को महापुरूषों को खोजने की आवश्यकता नहीं है। किंवदंतियों को खोजने में समय लगता है और हम नहीं चाहते कि हमारे दर्शक इस पर समय बर्बाद करें।

उदाहरण में हम नेटफ्लिक्स पर देखे गए शो का अनुपात देखते हैं। हम साफ देख सकते हैं कि यहां Movies को ज्यादा पसंद किया जाता है।

पाई चार्ट के साथ काम करना

रंग फूस का चयन

के लिए स्पष्ट डेटा, ए गुणात्मक कलर पैलेट डिस्प्ले के लिए सबसे अच्छा काम करता है। पहुंच सुनिश्चित करने के लिए असाइन किए गए रंग आसानी से अलग होने चाहिए।

के लिए सांख्यिक डेटा, ए अनुक्रमिक कलर पैलेट डिस्प्ले के लिए सबसे अच्छा काम करता है। क्योंकि संख्यात्मक डेटा को एक विशिष्ट क्रम (आरोही, अवरोही) में रखा जाना चाहिए।

A विभिन्न रंग पैलेट 2 अनुक्रमिक पट्टियों का एक संयोजन है जिसका केंद्रीय मान आमतौर पर शून्य होता है।

नीचे दी गई छवि रंग संदर्भ के लिए प्लॉटली से ली गई है।

रंग फूस का चयन
छवि 2

एंड नोट्स

हमने चार्ट में कुछ सामान्य गलतियाँ देखीं और कुछ उदाहरणों के साथ उन्हें कैसे दूर किया जाए। यदि आपके कोई प्रश्न हैं, तो आप इनमें से किसी भी मीडिया पर मुझसे संपर्क कर सकते हैं।

डेटा विज़ुअलाइज़ेशन एक कला रूप है जिसमें समय के साथ महारत हासिल करने की आवश्यकता होती है। ये डेटा विज़ुअलाइज़ेशन टिप्स और तकनीकें, हालांकि व्यापक नहीं हैं, लेकिन निश्चित रूप से आपको सही रास्ते पर जाने में मदद करेंगी। हमेशा याद रखें कि हम चार्ट या विज़ुअल बनाते हैं, अपनी समझ के लिए नहीं हम ये चार्ट इसलिए बनाते हैं ताकि दर्शक तकनीकी सामान में जाए बिना समझ सकें। दर्शकों के परिप्रेक्ष्य को समझना सफल और प्रभावी दृश्य बनाने की कुंजी है।

इससे कोई फ़र्क नहीं पड़ता कि आपने सुरुचिपूर्ण और शिष्ट चार्ट बनाने के लिए किस टूल का उपयोग किया, यह महत्वपूर्ण है कि हमने दृश्यों के पीछे का सार प्रदान किया।

लिंक्डइन | Kaggle | मध्यम | एनालिटिक्स विधा

छवि स्रोत

  1. इमेज 1: https://www.kaggle.com/kashishrastogi/store-sales-forecasting
  2. छवि 2 - https://plotly.com/python/builtin-colorscales/

स्रोत: https://www.analyticsvidhya.com/blog/2021/10/10-ideas-that-every-professional-should-avoid-for-data-visualization/

समय टिकट:

से अधिक एनालिटिक्स विधा