데이터 시각화를 위해 모든 전문가가 피해야 할 10가지 아이디어

소스 노드 : 1194875
데이터 시각화를 위해 피해야 할 아이디어 이미지
이미지 출처: 타라스 바쿠세비치

데이터는 우리가 수없이 들어왔던 새로운 석유입니다. 하지만 해당 데이터를 적절한 형식으로 시각화할 수 있을까요? 오늘날 우리가 처리할 수 있는 데이터의 양이 많기 때문에 데이터에서 통찰력을 추출하는 것이 그 어느 때보다 중요합니다. 매일 수백 개의 시각화가 생성됩니다. 일부는 청중으로부터 좋은 평가를 받는 반면 다른 일부는 거부됩니다. 왜 그렇습니까? 답은 창조에 있습니다. 원인과 문제점을 알아보고 해결방법을 알아보겠습니다.

여기서는 차트의 최고 버전과 최악 버전을 요약해 보겠습니다. 따라서 이 작업을 하고 있다면 중지해도 됩니다.

기준선이 0인 차트 시작

차트를 그리는 동안 제가 발견한 가장 일반적인 실수 중 하나는 0 기준선으로 차트를 시작하지 않고 임의의 값을 사용하는 것입니다.

데이터 시각화를 위해 피해야 할 아이디어 | 0 기준선

올바른 플로팅 막대 차트 사용

올바른 플로팅 막대 차트 사용 | 데이터 시각화를 위해 피해야 할 아이디어

우리는 데이터 시각화에서 일반적으로 가로 또는 세로 막대 차트를 사용했습니다. 때로는 비교를 위해 간단한 막대 차트를 사용하면 메시지가 잘 전달되지만 세로로 쌓인 막대 차트나 가로로 쌓인 막대 차트가 더 좋습니다. 예를 들어 보겠습니다.

예 1 :

여성과 남성의 월별 매출 데이터가 있습니다. 두 차트 모두 모든 사분면에 대한 성별 비율의 비교를 보여줍니다. 비교를 위해 아래 차트를 사용할 수 있습니다.

올바른 플로팅 막대 차트 사용 | 데이터 시각화를 위해 피해야 할 아이디어

차트의 같은 쪽에 양수 값과 음수 값을 표시하지 마십시오. 또는 차트의 같은 쪽에 비교 기능을 표시하지 마십시오. 차트를 읽기가 어려워집니다.

차트의 다양한 색상

차트에서 여러 색상을 사용해야 하는 이유는 다음과 같습니다. 차트에서 색상을 터무니없이 사용하는 것은 차트를 보는 동안 정말 꺼려집니다. 차트에서는 주로 2가지 색상만 사용했습니다.

차트의 여러 색상 | 데이터 시각화를 위해 피해야 할 아이디어

차트가 2개 이상인 경우 차트를 색상별로 분리하는 것이 좋습니다. 어떻게 그렇게 할 수 있는지 살펴보겠습니다.

차트의 여러 색상 | 데이터 시각화를 위해 피해야 할 아이디어

여기에서 볼 수 있듯이 각 열에는 고유한 목적이 있으므로 동일한 색상을 지정하면 흥미로워 보이지 않습니다. 따라서 여기서는 동일한 목적을 나타내는 차트에만 동일한 색상을 지정했습니다.

데이터에 대한 강조

때로는 데이터를 강조하면 차트가 보기 좋게 보일 수도 있습니다. 언뜻보기에 우리는 C 가치는 더 높은 우리가 사용한 다른 모든 기능 중에서.

여기에는 4개의 기능만 있으므로 차트의 이 작은 변화는 그다지 효과적이지 않지만 100개의 기능으로 작업할 때 기능의 가장 높은 값을 강조 표시하면 많은 도움이 됩니다. 100개의 특성을 갖고 이를 도표화하는 것은 어려운 작업이지만 그 순간 상위 10개 특성은 회색으로 강조 표시되고 다른 특성은 분홍색으로 강조 표시되는 조건을 전달할 수 있습니다.

혼란스러운 색상 선택

글꼴, 색상, 축 이러한 모든 기능은 차트를 그리는 동안 중요합니다. 차트의 색상을 선택하는 것은 매우 중요한 단계입니다. 차트에 너무 밝거나 밝은 색상이 있으면 차트를 읽기가 어려워지기 때문입니다.

이 예에는 해당 지역의 최고 매출부터 최저 매출까지 색상별로 구분하여 표시하는 2개의 차트가 있습니다. 왼쪽 차트를 보면 노란색의 다양한 음영이 육안으로 보이지 않습니다. 오른쪽에는 파란색과 분홍색의 색상 스케일이 있어 색상을 쉽게 구분할 수 있습니다.

혼란스러운 색상 선택

차트의 무작위성을 피하세요

막대는 항상 해당 값에 따라 오름차순 또는 내림차순으로 정렬됩니다. 가로 막대 차트의 경우 가장 큰 값을 위쪽에 배치하고 세로 막대 차트의 경우 가장 큰 값을 왼쪽에 배치합니다. 이는 청중이 차트에서 가장 높은 값과 가장 낮은 값을 찾는 데 도움이 됩니다.

차트의 무작위성을 피하세요

이야기를 들려주거나 최소한 질문에 답해 주세요.

대부분의 시작용 데이터 시각화 도우미는 히스토그램이나 막대와 같은 단일 차트만 만듭니다. 때로는 2개의 차트를 결합하는 것도 도움이 됩니다. 어떻게 완료되었는지 살펴보겠습니다.

에서 데이터를 찾을 수 있습니다. 카글수첩. 그래서 여기에는 제품, 매장 및 클러스터의 평균 매출 분석을 위한 차트를 만들었습니다. 원형 및 막대형 차트와 같은 다양한 차트를 만들 수 있지만 분석 개요를 위해 모든 차트를 하나로 결합했습니다. 여기서 우리는 A 매장의 매출이 가장 높고 자주 구매하는 제품이 식료품과 음료임을 분명히 알 수 있습니다.

이야기를 들려주거나 최소한 질문에 답해 주세요.
이미지 1

필요에 따라 컨텍스트 추가

추가 텍스트를 추가하는 것이 독자가 차트를 더 잘 이해하는 데 도움이 된다고 생각되면 텍스트만 추가하세요. 실제 사례를 통해 살펴보겠습니다. 이 차트는 다음에서 찾을 수 있습니다. 카글

차트는 Netflix에서 가장 높은 평가를 받은 TV 프로그램이나 영화를 알려줍니다. 여기에 TV 쇼보다는 영화를 좋아하는 청중의 97%와 같은 텍스트를 추가했습니다. 따라서 시청자는 차트를 읽을 때 시청자가 TV 쇼보다 영화를 선호한다는 것을 알 수 있으며 쇼 간의 등급을 비교할 수 있습니다.

필요에 따라 컨텍스트 추가

가장 높은 값을 갖는 막대의 색상 변경과 같은 일부 기능을 강조합니다. 여기서는 Netflix에 대해 이야기하고 있으므로 차트에 단순한 흰색이 아닌 빨간색과 검정색을 선택했습니다.

원형 차트 작업

나는 원형 차트를 잘못된 방식으로 사용하는 사람들을 많이 보았습니다.

원형 차트 작업 시 기억해야 할 사항

  • 원형 차트에 5개 이상의 값을 사용하지 마세요.
  • 항상 적절한 레이블을 지정하십시오. 차트를 얼마나 훌륭하게 표현했는지는 중요하지 않습니다. 차트에 직접 라벨을 붙이는 것은 청중이 범례를 찾을 필요가 없기 때문에 매우 유용합니다. 전설을 찾으려면 시간이 필요하며 우리는 청중이 이것에 시간을 낭비하는 것을 원하지 않습니다.

이 예에서는 Netflix에서 시청한 프로그램의 비율을 볼 수 있습니다. 여기서는 영화가 더 선호된다는 것을 분명히 알 수 있습니다.

원형 차트 작업

색상 팔레트 선택

럭셔리 범주 형 데이터, 질적 색상 팔레트는 디스플레이에 가장 적합합니다. 할당된 색상은 접근성을 보장하기 위해 쉽게 구별되어야 합니다.

럭셔리 숫자 데이터, 순차 색상 팔레트는 디스플레이에 가장 적합합니다. 숫자 데이터를 특정 순서(오름차순, 내림차순)로 배치해야 하기 때문입니다.

A 다른 색상 팔레트는 중앙 값이 일반적으로 2인 XNUMX개의 순차적 팔레트의 조합입니다.

아래 이미지는 Plotly에서 색상 참조를 위해 가져온 것입니다.

색상 팔레트 선택
이미지 2

최종 메모

우리는 차트에서 흔히 발생하는 몇 가지 실수와 몇 가지 예를 통해 이를 극복하는 방법을 살펴보았습니다. 문의사항이 있으시면 이 미디어를 통해 저에게 연락하실 수 있습니다.

데이터 시각화는 시간이 지남에 따라 숙달되어야 하는 예술 형식입니다. 이러한 데이터 시각화 팁과 기술은 포괄적이지는 않지만 올바른 방향으로 나아가는 데 확실히 도움이 될 것입니다. 우리는 차트나 시각적 자료를 만드는 것이지 이해를 위해 만드는 것이 아니라 기술적인 내용을 다루지 않고도 청중이 이해할 수 있도록 차트를 만드는 것임을 항상 기억하십시오. 청중의 관점을 이해하는 것은 성공적이고 효과적인 영상을 만드는 열쇠입니다.

우아하고 예의바른 차트를 만드는 데 어떤 도구를 사용했는지는 중요하지 않습니다. 시각적 요소 뒤에 숨은 본질을 전달하는 것이 중요합니다.

링크드인 | 카글 | 중급 | 분석 Vidhya

이미지 소스

  1. 이미지 1: https://www.kaggle.com/kashishrastogi/store-sales-forecasting
  2. 이미지 2 - https://plotly.com/python/builtin-colorscales/

출처: https://www.analyticsvidhya.com/blog/2021/10/10-ideas-that-every-professional-should-avoid-for-data-visualization/

타임 스탬프 :

더보기 분석 Vidhya