일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 기초통계
- 최종 프로젝트
- 클러스터링
- 프로젝트
- 데이터분석
- 태블로
- Chat GPT
- 크롤링
- GA4
- 팀프로젝트
- 프롬프트 엔지니어링
- 시각화
- 데이터 분석
- pandas
- jd
- 히트맵
- 기초프로젝트
- If
- SQL
- 전처리
- Python
- 머신러닝
- lambda
- 서브쿼리
- cross join
- streamlit
- 군집화
- data analyst
- SQLD
- da
Archives
- Today
- Total
목록데이터 품질 검사 (1)
세조목
실전 프로젝트 8일차(24.03.07)
1. 문제 풀기 실전 프로젝트 8일차입니다. 금일은 지옥 난이도 문제와 대시보드 작업을 진행했습니다. 지옥 난이도의 문제는 앞선 고급-2 문제의 연장선으로, 고급-2에서 세션의 간격이 30분이 넘어가는 경우가 차지하는 비중이 어느정도인지 확인했다면 지옥 난이도에서는 30분이 넘어가는 이유에 대해서 확인해야했습니다. 우선 세션의 간격이 30분이 넘어가는 session_id들만을 별도로 확인해보았는데요, event_type에 하나의 패턴을 발견할 수 있었습니다. department-product-cart가 반복되는 패턴입니다. 여러가지 가설들을 세워보긴했으나 이렇다할 가설은 찾을수 없었습니다. 하지만 created_at 컬럼을 보았을때 각각의 event들간 간격이 짧은건 초 단위, 조금 긴건 분 단위인것으로..
데이터 분석 공부/프로젝트
2024. 3. 7. 22:29