세조목

데이터 시각화는 왜 중요할까? 본문

데이터 분석 공부/아티클 요약 및 정리

데이터 시각화는 왜 중요할까?

세조목 2023. 12. 12. 15:51

https://yozm.wishket.com/magazine/detail/1750/

 

데이터 시각화 101: ① 데이터 시각화는 왜 중요할까? | 요즘IT

데이터의 양이 늘어나고 복잡해질 수록 데이터를 좀 더 쉽게 이해하고 인사이트를 발견하는 것의 필요성이 높아지고 있는데요. 데이터 시각화란 말 그대로 데이터에서 발견한 정보를 시각적으

yozm.wishket.com

데이터 시각화

  1. 데이터에서 발견한 정보를 시각적으로 이해할 수 있도록 그래픽 형태로 표현하는 것
  2. 정보들이 시각요소로 매핑되어 그래픽 형태로 표현되는 것

※ 매핑이란? 어떤값을 다른 값에 대응시키는 과정

 

우리 주변의 데이터 시각화

 

네이버 지도, 기상청 자료, 바이러스 확진자 현황, 선거 자료 등 다양한 영역에서 데이터를 시각화해서

사람들에게 제공하고 있으며 사람들은 이렇게 제공받은 시각화 데이터를 바탕으로 의사결정을 내린다.

텍스트나 숫자로 공유해도 볼 사람은 볼텐데 왜 시각화를 하는걸까?

크게 네가지 이유가 있는데 네가지 이유는 아래와 같다.

  1. 시각정보는 쉽게 알 수 있다.
  2. '아하'순간을 통해 인사이트를 발견하다.
  3. 의사결정에 도움을 준다.
  4. 일상 속 데이터 시각화의 중요성

각각의 이유들에 대해서 조금 더 자세히 알아보자

 

1. 시각정보는 쉽게 알 수 있다

 

시각(Sight)은 시간당 처리하는 정보의 양이 다른 감각들에 비해 훨씬 많다.

우측 아래 콩알만한 흰색 부분은  실제로 우리가 인식하는 부분인데 이 흰색부분과 시각을 나타내는

파란색 부분을 비교해보면 우리가 인식하는 정보들은 아주 일부에 불과하고, 실제로 우리 뇌가 처리하고

알아차리는 정보들이 얼마나 많은지를 알 수 있다.

 

우리가 시각으로 인지하는 요소들 중 텍스트와 그래픽을 비교해보자.

3M 社에 따르면 그래픽은 텍스트에 비해 6만배 빠르게 처리된다고하며

HubSpot의 소셜미디어 사이언티스트 댄 자렐라의 말에 따르면 이미지를 포함한 트윗이 이미지가 없는 트윗에 비해 95% 이상 더 리트윗된다고 한다.

 

2. '아하' 순간을 통해 인사이트를 발견하다

앞서 살펴봤던 것처럼 데이터가 시각화되면 우리 뇌는 빠른 속도로 많은 양의 정보를 처리할 수 있다보니

트렌드, 패턴, 아웃라이어 등을 쉽게 파악할 수 있고 그 결과 데이터에 대한 인사이트를 쉽게 발견할 수 있다.

 ※ 아웃라이어란 : 데이터 상의 다른 값들의 분포와 비교했을때 비정상적으로 떨어져있는 관측치

 

아래 두 가지 예시를 살펴보자

 

 1)  How People in America Spend Their Day

위 데이터는 2008년에 미국인들이 하루를 어떻게 보내는지를 나타내고있다.

첫번째 이미지는 수치로만, 두번째 이미지는 이 수치들을 시각화해놓은 것이다.

두번째 이미지에서 각 활동은 카테고리별로 나누어 고유한 색으로 정의했고, 할애한 시간은 면적으로 보여주고 있으며 우측 상단에는 직업별, 성별, 인종별 그룹으로 나누어놓았다.

시각화를 통해서 데이터 테이블만으로는 찾기 어려운 많은 정보를 직관적으로 이해하고 패턴을 찾고, 인사이트를 발견해낼 수 있음을 알 수 있다.

 

 2) Million Dollar Blocks

두번째 예시는

  1. 범죄자들을 수감하기 위해 필요한 비용은 얼마인지
  2. 그리고 그들이 어디에 수감되어있는지

를 조사한 데이터를 시각화한 것이다.

수감 비용이 높을수록 붉은색이 더 진하게 표시되게끔함으로써 수감비용이 일부지역에 집중되어 있다는 것을

직관적으로 파악할 수 있는 동시에 지역사회의 특성과 높은 수감비용 사이에 어떠한 연관성이 있는지에 대한

인사이트를 얻을 수도 있다.

 

3. 의사 결정에 도움을 준다

시각화된 데이터가 어떤 점에서 우리들의 의사결정에 도움을 줄 수 있을까?

아래 세가지 부분에서 시각화된 데이터는 우리들의 의사결정에 도움을 준다.

  1. 한눈에 많은 양의 데이터를 파악하고 청사진을 그릴수 있다.
  2. 우리의 뇌는 시각화된 정보를 처리하는데 특화되어있기때문에 시각화된 데이터를 쉽게 이해할 수 있다.
  3. 다소 생소하거나 관심이 적은 주제를 다룰때 흥미를 불러일으킬 수 있다.

시각화된 데이터가 의사결정에 도움을 준 사례 두 가지 정도 살펴보자.

 

 1) 전염병의 원인을 알린 고스트맵(런던 콜레라)

1854년 런던에서 콜레라 발병으로 인해 열흘 만에 500명이 사망했다.

의사 존 스노우(John Snow)는 콜레라의 전염 경로가 물이라고 수년 동안 주장했지만 보건당국은 그의 말을 무시했다.

그래서 그는 주민들과 면담한 내용을 바탕으로 주소별 사망자 수를 검은색 막대로 나타내는 지도를 만들었는데

도시 중앙 물 펌프에 가까울수록 사망자 수가 많은 것을 알 수 있었다.

이렇게 시각화한 자료를 바탕으로 정부당국에게 콜레라의 전염 경로가 물이라는 사실을 계속해서 알렸고,

존 스노우의 주장을 받아들인 정부는 정수장을 짓고, 주민들에게 물을 끓여 마시라고 얘기했다.

그 결과 런던에서 대규모로 콜레라가 발생한 적은 한번도 없게되었다.

 

 2) 코로나 바이러스 시뮬레이션

위 시각화 자료는 워싱턴 포스트의 그래픽 기자 해리 스티븐스(Harry Stevens)가 사회적 거리두기가 코로나 확산에 미치는 영향을 이해하기 위해 가상의 바이러스를 이용해 제작한 시뮬레이션이다.

시간이 지남에따라 회복한 사람(Recovered), 건강한 사람(Healthy), 아픈 사람(Sick)의 비중이 변하는 것을 확인할 수 있는데 그는 아래 네 가지 상황에 위 시뮬레이션을 적용해보았다.

  1. 이동 제한이 없을때(Free_for_all)
  2. 강제 격리를 시도했을때(Attempted quarantine)
  3. 보통 수준의 사회적 거리두기(Moderate distancing)
  4. 철저한 사회적 거리두기(Extensive distancing)

철저한 사회적 거리두기(Extensive distancing)가 코로나 확산을 막는데 가장 효과적임을 한눈에 알 수 있다.

시각화를 통해 사회적 거리두기의 영향이라는 다소 복잡한 주제를 사람들에게 쉽게 이해시키고,

관심을 높일 수 있었던 대표적인 사례이다.

 

4. 일상 속 데이터 시각화의 중요성

지금까지 살펴본 예시들 외에도 우리들의 실생활과 밀접하게 연관된 데이터 시각화 활용 예시들은 다양하다.

시간이 지날수록 더욱 많은 양의 데이터가 생겨나고, 또 데이터들의 복잡성이 증가할 것이다.

그럴수록 조직에서 의사결정을 내릴때 데이터를 잘 활용하는 것이 점점 더 중요해질텐데 

프로젝트의 청사진을 그리고, 데이터를 쉽게 이해시키며, 인사이트 발견을 용이하게하는

데이터 시각화가 이같은 데이터 기반 의사결정에 중요한 역할을 할 것이다.