일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- pandas
- 크롤링
- 프로젝트
- SQLD
- 히트맵
- streamlit
- cross join
- 머신러닝
- 서브쿼리
- 전처리
- 시각화
- 기초프로젝트
- Chat GPT
- 태블로
- 프롬프트 엔지니어링
- 기초통계
- 데이터분석
- 최종 프로젝트
- Python
- 클러스터링
- GA4
- data analyst
- 군집화
- 팀프로젝트
- 데이터 분석
- lambda
- da
- If
- jd
- SQL
- Today
- Total
목록데이터 분석 공부/프로젝트 (53)
세조목
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cfMhv4/btsEMYwoN2A/sKPXkLrtvbukxTvC8MriOk/img.png)
심화 프로젝트 8, 9일차에는 아래 To Do 리스트에 따라 ECDF 코드 작성과 CC(Carrying Capacity)계산을 수행했습니다. 동제 : 케어링 케퍼시티(학습 & 시간 여유 있으면 직접 구해보기) 정희 : ECDF 지훈 : 블랙프라이데이 전주, 블랙프라이데이 주, 블랙플라이데이 그 다음주 ID별 totals 계산 지훈 1. 16년 8월부터 17년 8월 순서로 바 그래프 그리기 2. 16년 10월, 11월 channelGrouping 별 파이차트 동제 1. 첫 방문자 중 구매한 시점의 분포를 구해보기(for 신규고객 정의) 정희 1. 이탈자 수 counting하기위해 이탈 기간을 어느 정도로 잡는게 적정한지 파악 ECDF 코드 작성 group = train_df2.groupby(['date',..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bJKvWe/btsEHF3u3l6/PKFzd1ikvxkuYEDHDfQGf1/img.png)
시간별/요일별 사용자수 히트맵 1. UNIX타임스탬프를 일반시간으로 변경하고 컬럼으로 추가 visitStartTime_UTC = pd.to_datetime(train_df2['visitStartTime'], unit='s') train_df2['visitStartTime_UTC'] = visitStartTime_UTC 2. 시간 구하기 train_df2['hour'] = train_df2['visitStartTime_UTC'].dt.hour 3. 요일 구하기 train_df2['day_of_the_week'] = train_df2['date'].dt.weekday 4. 코호트 차트 만들기 grouping = train_df2.groupby(['day_of_the_week', 'hour']) cohort_..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bNPS9X/btsEKEQkzE3/9bkBkRHy6N71B8iJFzkVPk/img.png)
1. 코호트 분석에 필요한 컬럼들로 구성된 데이터프레임 만들기 df = train_df2[['date_week', 'fullVisitorId']] 2. 고객ID('fullVisitorId')를 인덱스로 지정하기 df.set_index('fullVisitorId', inplace=True) # set_index('fullVisitorId') => 'fullVisitorId' 컬럼을 인덱스로 쓰겠다. # inplace=True => 기존 데이터프레임에 변경된 설정으로 덮어쓰겠다. 3. df의 인덱스('fullVisitorId')를 기준으로 방문 주차('date_week')의 최소값 구하기 FirstOrder = df.groupby(df.index)['date_week'].min() df['FirstOrder..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/FUDqG/btsEFiutZvJ/wXVMR1PwpkhQIBTPY8URL0/img.png)
DAU # data type을 날짜로 변환 train_df2['date'] = train_df2['date'].apply(lambda x: pd.to_datetime(str(x), format = '%Y%m%d')) # DAU 라인 차트로 표시 a = train_df2.groupby(['date'], as_index=False).agg({'fullVisitorId' : pd.Series.nunique}) sns.lineplot(data = a, x = 'date', y = 'fullVisitorId') WAU train_df2['date_week'] = train_df2['date'].dt.isocalendar().week WAU = train_df2.groupby(['date_week'], as_ind..