일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 서브쿼리
- da
- 태블로
- 기초프로젝트
- Chat GPT
- 프로젝트
- data analyst
- 히트맵
- Python
- SQL
- 최종 프로젝트
- 클러스터링
- 데이터분석
- jd
- 군집화
- 팀프로젝트
- 시각화
- lambda
- 데이터 분석
- 머신러닝
- streamlit
- If
- 전처리
- 크롤링
- SQLD
- 프롬프트 엔지니어링
- GA4
- pandas
- 기초통계
- cross join
- Today
- Total
목록데이터 분석 공부/프로젝트 (53)
세조목
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cvQEpF/btsFnV6rzvZ/eXKnGkUj3XwaARtIFV5ZYK/img.png)
실전 프로젝트 3일차입니다. 금일은 어제 만들었던 시각화 자료들은 한 번 더 체크하고, 중급 난이도 문제를 풀어보았습니다. 두번째 중급 난이도 문제는 event가 발생하지 않은 유저/상품 쌍의 존재여부를 merge하여 집계하고 그 비율을 파이 차트로 시각화하는 것입니다. LOD식을 작성했을때 EVENT가 없는 USER와 PRODUCT는 없는 것으로 확인이 됐습니다. 제가 계산을 잘못했을수도 있고, LOD식을 활용하는 것이 아닐수도 있습니다. 관련해서는 내일 다시 한 번 고민해보려고합니다.
2024.03.01 - [데이터 분석 공부/태블로] - 태블로 - 계산식(LOD식, IF조건문) 태블로 - 계산식(LOD식, IF조건문) 실전 프로젝트를 진행하면서 태블로로 시각화할 때 계산식을 꽤 많이 활용하고있다. '두 명 이상의 ~~~', '두 가지 이상의 ~~~', 'user_id가 없는 ~~~'와 같은 조건들 말이다. python에서야 groupby 메서드 eyeoftheworld1209.tistory.com 금일은 실전 프로젝트 2일차로 주어진 문제를 해결하기위해 고민하는 시간을 가졌습니다. 고민하는 과정에서 태블로에서 조건식을 작성하기위해서는 어떻게 해야하는지 학습할 수 있었습니다.
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bQRtxn/btsFq0ZJKTz/ZiON03iBWF5A7UYrcHBPEk/img.png)
태블로를 활용하는 실전 프로젝트가 시작됐습니다. 저희 조는 이커머스 데이터 품질 검사를 주제로 프로젝트를 진행하기로했습니다. 오늘은 프로젝트 주제를 선정하고, GitHub 레포지토리를 개설했습니다. https://github.com/gabrietofu/B01_Data_Quality_Check 태블로에서 데이터 테이블을 결합하고 1번 문제를 살짝 맛보는 단계까지 진행했습니다. 테이블을 결합하는 과정에서 저희가 생각했을때 PK(Primary Key)라고 생각하는 user_id컬럼을 선택하면 아래와 같은 에러가 발생했습니다. 원인을 확인해본 결과 두 테이블 컬럼의 데이터 타입이 상이한것이 문제였습니다. 관련해서는 아래 포스팅에 정리해두었습니다. 2024.02.29 - [데이터 분석 공부/태블로] - 태블로 -..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/yJpCZ/btsE7tAXxGd/OciYQESzdQLqZ36ZVKKlR0/img.png)
심화 프로젝트가 끝이 났습니다. 저희 팀의 경우 이번 프로젝트 말미에 차후 분석과제에 대해서 언급했는데요, 차후 분석과제에는 ECDF 결과를 바탕으로 어떻게 하면 사람들이 웹페이지에 더 오래 머무르게 할 수 있을지에 대한 액션 플랜 도출, 머신러닝 특히 클러스터링 분석을 활용한 세그먼테이션 및 세그먼트별 액션 플랜 도출 이 포함되어있습니다. 저희 팀이 분석을 끝마친건 저번주 목요일로 PPT제작 시간을 고려한다면 금요일과 토요일까지 추가 분석 시간이 있긴했습니다. 하지만 추가 분석을 진행하지는 않았는데요, 몇 가지 이유가 있었지만 가장 큰 이유는 팀원 대부분이 금번 프로젝트 결과물을 포트폴리오로 활용할 생각이 없었기때문입니다. 다른 팀원들은 어떤 이유에서인지는 모르겠으나 저의 경우 사이드 프로젝트로 지인의..