일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 머신러닝
- 태블로
- da
- 시각화
- 기초통계
- 기초프로젝트
- Chat GPT
- jd
- 군집화
- 데이터분석
- 프로젝트
- lambda
- cross join
- 전처리
- SQLD
- 데이터 분석
- SQL
- 크롤링
- 최종 프로젝트
- pandas
- 서브쿼리
- Python
- 프롬프트 엔지니어링
- 팀프로젝트
- data analyst
- GA4
- 히트맵
- If
- 클러스터링
- streamlit
- Today
- Total
목록데이터 분석 공부/프로젝트 (53)
세조목
1. 문제 풀기 실전 프로젝트 8일차입니다. 금일은 지옥 난이도 문제와 대시보드 작업을 진행했습니다. 지옥 난이도의 문제는 앞선 고급-2 문제의 연장선으로, 고급-2에서 세션의 간격이 30분이 넘어가는 경우가 차지하는 비중이 어느정도인지 확인했다면 지옥 난이도에서는 30분이 넘어가는 이유에 대해서 확인해야했습니다. 우선 세션의 간격이 30분이 넘어가는 session_id들만을 별도로 확인해보았는데요, event_type에 하나의 패턴을 발견할 수 있었습니다. department-product-cart가 반복되는 패턴입니다. 여러가지 가설들을 세워보긴했으나 이렇다할 가설은 찾을수 없었습니다. 하지만 created_at 컬럼을 보았을때 각각의 event들간 간격이 짧은건 초 단위, 조금 긴건 분 단위인것으로..
실전 프로젝트 7일차입니다. 금일은 팀원들과 함께 (고급)-1, 2, 그리고 (지옥) 난이도 문제를 풀었습니다. (고급)-1의 경우 구매 시각 이전에 event가 발생했는지 여부를 확인해야했습니다. 태블로 내에서 해당 작업을 수행하는 것에 어려움을 느껴 파이썬에서 전처리를 진행했는데요, 1. event 테이블 df = pd.read_csv('N:/개인/데이터 분석/내배캠/4. 실전 프로젝트/events.csv') # product_id 추출 event = df[df['uri'].str.contains('product/')] event_2 = event.uri.str.split('/') event_2 = event_2.str.get(2) event['uri_num'] = event_2 event_df = ..
실전 프로젝트 6일차입니다. 금일은 (중급)-1 라인 차트 그리기 (고급)-1 파이 차트(or else) 그리기 (고급)-2 & (지옥) 개별적으로 풀어보기 를 진행했습니다. (중급)-1 의 경우 앞서 풀었던 (초급)-1~3 문제를 한 번에 표현하는 것으로 위와같이 시각화했습니다. (고급)-1의 경우 의문사항이 생겨 기존의 데이터를 가지고서 시각화를 진행할 수가 없었습니다. (고급)-1은 아래와 같은데요, 저희는 아래와 같이 각각의 테이블에서 user_id와 product_id(첫번째 fixed에서의 경우 split)를 기준으로 created_at의 최소값을 구해서 전자가 후자보다 작은지를 구해보았습니다. FIXED [User Id], [split] : MIN([Created At]) } < { FIXE..
연휴 기간동안 금번 프로젝트의 문제들을 풀어봤습니다. 2024.03.01 - [데이터 분석 공부/프로젝트] - 실전 프로젝트 2일차(24.03.01) 2024.03.02 - [데이터 분석 공부/프로젝트] - 실전 프로젝트 3일차(24.03.02) 3일차때까지 초급 난이도 문제들은 모두 풀어봤는데 중급 난이도 문제들을 풀지 못하여 어제는 중급 난이도 문제 풀이에 집중했고, 연휴 기간동안 팀원들 각자가 풀어본 문제들을 가지고서 금일은 브리핑을 진행했습니다. 우선 중급 난이도 문제들에는 가 있었는데 (중급)-1의 요구사항인 초급단계에서 구한 세 가지 값을 월별로 집계하여 Line Chart로 만드는 것이 쉽지 않았습니다. 저의 경우 이렇게 조건식을 만들어서 문제들을 풀었기 때문에 이 조건들을 모두 하나의 시트..