일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 데이터 분석
- SQLD
- 프로젝트
- 시각화
- Chat GPT
- 크롤링
- 기초프로젝트
- Python
- 히트맵
- GA4
- 최종 프로젝트
- pandas
- 머신러닝
- 전처리
- 기초통계
- jd
- 프롬프트 엔지니어링
- cross join
- 데이터분석
- 팀프로젝트
- 클러스터링
- 군집화
- data analyst
- 서브쿼리
- 태블로
- lambda
- SQL
- da
- If
- streamlit
- Today
- Total
목록데이터 분석 공부 (325)
세조목
태블로 2024.03.01 - [데이터 분석 공부/태블로] - 태블로 - 계산식(LOD식, IF조건문) 태블로 - 계산식(LOD식, IF조건문) 실전 프로젝트를 진행하면서 태블로로 시각화할 때 계산식을 꽤 많이 활용하고있다. '두 명 이상의 ~~~', '두 가지 이상의 ~~~', 'user_id가 없는 ~~~'와 같은 조건들 말이다. python에서야 groupby 메서드 eyeoftheworld1209.tistory.com SQLD
실전 프로젝트를 진행하면서 태블로로 시각화할 때 계산식을 꽤 많이 활용하고있다. '두 명 이상의 ~~~', '두 가지 이상의 ~~~', 'user_id가 없는 ~~~'와 같은 조건들 말이다. python에서야 groupby 메서드로 a를 기준으로 b를 집계한 다음 그 값들을 가지고서 boolean 인덱싱하면 조건에 해당하는 값들을 쉽게 소팅할 수 있는데 태블로에서는 python에서와같은 방법을 활용할 수 없어서 많은 시간 고민을 해야했다. '계산된 필드 만들기' 가 방법이라는 것은 알고 있었지만 어떻게 계산식을 작성해야하는지가 문제였다. 아래 이미지는 금번 실전 프로젝트에서 우리가 풀어야 하는 과제인데 첫번째 문제를 보면 '두 명 이상의 unique user가 있는 세션의 수와 비율을 구하고 시각화화라'..
태블로 2024.02.29 - [데이터 분석 공부/태블로] - 태블로 - 테이블 결합 유의 사항, 연결 방식(라이브 vs 추출) 태블로 - 테이블 결합 유의 사항, 연결 방식(라이브 vs 추출) 1. 테이블 결합 유의사항 태블로에서 테이블과 테이블의 관계를 맺을때 데이터 타입이 동일해야 관계를 맺을 수 있습니다. 만약 데이터 타입이 다르다면 아래 이미지의 빨간 부분을 클릭해서 타 eyeoftheworld1209.tistory.com 실전 프로젝트 https://eyeoftheworld1209.tistory.com/entry/%EC%8B%A4%EC%A0%84-%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8-1%EC%9D%BC%EC%B0%A8240229 실전 프로젝트 1일차(24.02.29..
태블로를 활용하는 실전 프로젝트가 시작됐습니다. 저희 조는 이커머스 데이터 품질 검사를 주제로 프로젝트를 진행하기로했습니다. 오늘은 프로젝트 주제를 선정하고, GitHub 레포지토리를 개설했습니다. https://github.com/gabrietofu/B01_Data_Quality_Check 태블로에서 데이터 테이블을 결합하고 1번 문제를 살짝 맛보는 단계까지 진행했습니다. 테이블을 결합하는 과정에서 저희가 생각했을때 PK(Primary Key)라고 생각하는 user_id컬럼을 선택하면 아래와 같은 에러가 발생했습니다. 원인을 확인해본 결과 두 테이블 컬럼의 데이터 타입이 상이한것이 문제였습니다. 관련해서는 아래 포스팅에 정리해두었습니다. 2024.02.29 - [데이터 분석 공부/태블로] - 태블로 -..