일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 클러스터링
- 기초통계
- da
- 태블로
- SQL
- Python
- 데이터분석
- 서브쿼리
- SQLD
- 최종 프로젝트
- cross join
- lambda
- jd
- Chat GPT
- pandas
- 시각화
- If
- 프롬프트 엔지니어링
- 히트맵
- 크롤링
- data analyst
- streamlit
- 기초프로젝트
- GA4
- 팀프로젝트
- 머신러닝
- 군집화
- 프로젝트
- 데이터 분석
- 전처리
Archives
- Today
- Total
목록데이터 품질 검사 (1)
세조목
실전 프로젝트 8일차(24.03.07)
1. 문제 풀기 실전 프로젝트 8일차입니다. 금일은 지옥 난이도 문제와 대시보드 작업을 진행했습니다. 지옥 난이도의 문제는 앞선 고급-2 문제의 연장선으로, 고급-2에서 세션의 간격이 30분이 넘어가는 경우가 차지하는 비중이 어느정도인지 확인했다면 지옥 난이도에서는 30분이 넘어가는 이유에 대해서 확인해야했습니다. 우선 세션의 간격이 30분이 넘어가는 session_id들만을 별도로 확인해보았는데요, event_type에 하나의 패턴을 발견할 수 있었습니다. department-product-cart가 반복되는 패턴입니다. 여러가지 가설들을 세워보긴했으나 이렇다할 가설은 찾을수 없었습니다. 하지만 created_at 컬럼을 보았을때 각각의 event들간 간격이 짧은건 초 단위, 조금 긴건 분 단위인것으로..
데이터 분석 공부/프로젝트
2024. 3. 7. 22:29