일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- If
- lambda
- 팀프로젝트
- 군집화
- 기초프로젝트
- 머신러닝
- 전처리
- 프롬프트 엔지니어링
- 데이터분석
- 태블로
- Chat GPT
- 기초통계
- 데이터 분석
- data analyst
- 서브쿼리
- SQL
- cross join
- 시각화
- 크롤링
- GA4
- streamlit
- pandas
- da
- SQLD
- 클러스터링
- 프로젝트
- Python
- jd
- 최종 프로젝트
- 히트맵
Archives
- Today
- Total
세조목
데이터 리터러시를 올리는 방법 본문
https://yozm.wishket.com/magazine/detail/1632/
1. 데이터 리터러시의 정의
데이터 리터러시란?
데이터를 활용해 문제를 해결할 수 있는 능력
- 과거에는 회사의 구성원들에게 데이터를 빠르게 보여주기만 하면 잘 활용할 수 있을 것이라고 생각해서 데이터를 빠르게 제공하는데 초점을 맞췄음
- 그런데 문제는 협업팀(구성원들)이 문제 해결에 직접적으로 연관이 없는 데이터들도 요청한다는 점이었음
- 이러한 문제의 원인은 해결하려는 문제가 무엇인지 명확하게 정의되지 못하는데서부터 시작됨
어떻게 하면 문제를 명확하게 정의할 수 있을까??
데이터 활용
어떻게 하면 데이터를 잘 활용할 수 있을까??
1) 데이터/실험 기반 사고방식의 정착
2) 분석 흐름대로 데이터를 탐색할 수 있는 환경 필요
3) 이 과정을 도와주는 분석가들이 필요
2. 데이터/실험 기반 사고방식
- 실험 기반 프로세스 : 문제해결 時 실험의 방식을 차용한 프로세스
- 실험 진행 전 작성해야하는 내용
1 | 해결하려는 문제 | 문제 정의 |
2 | 관련 OKR | 전사 목표와 align 되어 있는지 |
3 | 측정 지표 | 문제와 지표가 align 되어있는지, 측정 가능한 것인지 |
4 | 가설 검증 기준 | 성공 여부를 어떻게 판단할 것인지 |
5 | 검증 후 변화될 액션 | 의미 없는 액션을 하는건 아닌지 |
6 | 결과 확인 | 검증 기준으로 결과자 나왔는지 |
7 | 학습한 점 | 무엇을 배웠고, 다음 시험에는 어떻게 반영할 것인지 |
* OKR : Objective and Key Results로 목표와 주요성과지표를 결합하여 조직이나 팀의 방향과 성과를 관리하는 프레임워크임
- 작성한 내용들을 바탕으로 실험 프로세스가 성공적으로 도입되면 구성원들로하여금 '문제정의 - 솔루션 - 측정지표' 를 만들어내는데 익숙해지게끔 할 수 있음
3. 분석 흐름대로 데이터를 탐색할 수 있는 환경
어떠한 환경이 갖추어져야 하는가?
1. 데이터맵(for 지표간의 관계 파악)
2. 대시보드(for 지표들의 중요한 변동 & 변동 원인 파악)
1) 데이터맵
데이터맵이란?
구성원들이 분석가 없이도 가장 중요한 지표에 집중할 수 있도록
전사(全社)에서 다루고 있는 중요한 인풋 지표와 아웃풋 지표 간의
관계를 표현한 관계도
- 인풋 지표 설정 時 중요한 지표 두 가지
1) 측정 가능
2) 직접적으로 control이 가능해야 함 - 위 두 가지 지표를 바탕으로 구성원들이 더 중요한 지표에 집중해서 문제를 해결할 수 있도록 함
- '관계도'를 통해서 각 지표 간의 관계를 쉽게 이해할 수 있고, 해결해야하는 문제가 어떤 지표와 연관되어있는지 빠르게 파악할 수 있음
2) 대시보드
- 대시보드는 원래 항공기의 여러가지 수치들을 확인할 수 있는 계기판을 의미함
- 항공기의 여러가지 수치들을 확인할 수 있는것처럼 기업의 운영과 관련된 여러가지 지표들을 하나의 판에서 확인할 수 있도록 함으로써 분석가가 아닌 구성원들도 각종 지표들의 중요한 변동과 변동 원인을 쉽고 빠르게 분석할 수 있음
4. 이 과정을 도와주는 분석가
- 데이터 분석가, 사이언티스트의 역할은 단순히 데이터를 수집, 정제, 분석, 인사이트 도출에 그치는 것이
아니라구성원들이 앞서 언급한 과정들을 수월하게 진행할 수 있도록 도움을 주는 존재임 - 많은 구성원들이 빠르게 데이터를 분석하려면 데이터를 빠르게 준비해서 사용할 수 있는 구조가 필요한데 핵심 세 가지는 아래와 같음1) 원천 데이터가 적재되어있는 데이터 레이크(이하 DL)
2) 원천데이터 중에서도 구조화된 원천데이터들이 적재된 데이터 웨어하우스(이하 DW)
3) DL과 DW에서 데이터를 쉽게 확인할 수 있도록 해주는 데이터 카탈로그(이하 DC)
5. 맺음말
- 데이터를 활용해서 문제를 해결할 수 있는 능력을 데이터 리터러시라고 정의하고있음
- 이같은 데이터 리터러시 역량을 바탕으로 전사적인 데이터 기반 의사결정 문화를 정착시키려면 경영진의 강한 지지뿐만 아니라, 팀 구성원 모두의 적극적인 노력과 참여가 모두 필요하다.
▲ 금번 아티클 분석을 통해서 느낀점
- 데이터 분석가(or 사이언티스트)의 역할이 단순 데이터 수집, 정제, 분석, 인사이트 도출에서 그치는 것이 아니라 협업팀에 속한 구성원들이 데이터를 활용해서 문제를 잘 해결할 수 있도록 가이드해주는 것이기도 하다는 사실에 대해서 알게 됨
- 문제 상황 발생시 그러한 문제를 해결하기 위해서 어떤 데이터를 활용해야하는지가 우선적으로 머릿속에 그려져야 하며 그렇게 되기 위해서는 문제에 영향을 미치는 요인들이 무엇인지에 대해서 구성원들과 충분히 얘기 나눠볼 필요가 있을 것 같음. 그 과정에서 데이터맵이라는 도구가 유용하게 쓰일 것 같음
'데이터 분석 공부 > 아티클 요약 및 정리' 카테고리의 다른 글
직관적인 데이터 시각화 만들기 (0) | 2023.12.14 |
---|---|
데이터 시각화는 왜 중요할까? (2) | 2023.12.12 |
데이터 분석이란 무엇일까? (4) | 2023.12.06 |