일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 태블로
- 크롤링
- cross join
- 클러스터링
- SQLD
- GA4
- 프로젝트
- 히트맵
- lambda
- 기초프로젝트
- 시각화
- 팀프로젝트
- 최종 프로젝트
- streamlit
- 머신러닝
- 서브쿼리
- 기초통계
- jd
- 데이터 분석
- da
- data analyst
- SQL
- 전처리
- Chat GPT
- 군집화
- Python
- 데이터분석
- If
- 프롬프트 엔지니어링
- pandas
Archives
- Today
- Total
목록LOD식 (2)
세조목
실전 프로젝트 3일차(24.03.02)
실전 프로젝트 3일차입니다. 금일은 어제 만들었던 시각화 자료들은 한 번 더 체크하고, 중급 난이도 문제를 풀어보았습니다. 두번째 중급 난이도 문제는 event가 발생하지 않은 유저/상품 쌍의 존재여부를 merge하여 집계하고 그 비율을 파이 차트로 시각화하는 것입니다. LOD식을 작성했을때 EVENT가 없는 USER와 PRODUCT는 없는 것으로 확인이 됐습니다. 제가 계산을 잘못했을수도 있고, LOD식을 활용하는 것이 아닐수도 있습니다. 관련해서는 내일 다시 한 번 고민해보려고합니다.
데이터 분석 공부/프로젝트
2024. 3. 2. 21:10
태블로 - 계산식(LOD식, IF조건문)
실전 프로젝트를 진행하면서 태블로로 시각화할 때 계산식을 꽤 많이 활용하고있다. '두 명 이상의 ~~~', '두 가지 이상의 ~~~', 'user_id가 없는 ~~~'와 같은 조건들 말이다. python에서야 groupby 메서드로 a를 기준으로 b를 집계한 다음 그 값들을 가지고서 boolean 인덱싱하면 조건에 해당하는 값들을 쉽게 소팅할 수 있는데 태블로에서는 python에서와같은 방법을 활용할 수 없어서 많은 시간 고민을 해야했다. '계산된 필드 만들기' 가 방법이라는 것은 알고 있었지만 어떻게 계산식을 작성해야하는지가 문제였다. 아래 이미지는 금번 실전 프로젝트에서 우리가 풀어야 하는 과제인데 첫번째 문제를 보면 '두 명 이상의 unique user가 있는 세션의 수와 비율을 구하고 시각화화라'..
데이터 분석 공부/태블로
2024. 3. 1. 20:58