일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- data analyst
- 태블로
- streamlit
- 크롤링
- SQL
- 머신러닝
- Chat GPT
- cross join
- 프로젝트
- If
- 전처리
- 최종 프로젝트
- pandas
- SQLD
- 데이터분석
- 서브쿼리
- 기초통계
- da
- 팀프로젝트
- 클러스터링
- 군집화
- 시각화
- jd
- Python
- 프롬프트 엔지니어링
- lambda
- 히트맵
- 기초프로젝트
- GA4
- 데이터 분석
Archives
- Today
- Total
세조목
심화 프로젝트 4~5일차(DAU, WAU, MAU구하기)(24.02.09~10) 본문
DAU
# data type을 날짜로 변환
train_df2['date'] = train_df2['date'].apply(lambda x: pd.to_datetime(str(x), format = '%Y%m%d'))
# DAU 라인 차트로 표시
a = train_df2.groupby(['date'], as_index=False).agg({'fullVisitorId' : pd.Series.nunique})
sns.lineplot(data = a, x = 'date', y = 'fullVisitorId')
WAU
train_df2['date_week'] = train_df2['date'].dt.isocalendar().week
WAU = train_df2.groupby(['date_week'], as_index=False).agg({'fullVisitorId' : pd.Series.nunique})
sns.lineplot(data = WAU, x = 'date_week', y='fullVisitorId')
MAU
MAU = train_df2.resample('M',on='date')['fullVisitorId'].nunique()
MAU = MAU.to_frame()
sns.lineplot(data = MAU, x = 'date', y='fullVisitorId')
DAU, WAU, MAU는 각각
Daily Activate Users,
Weekly Activate Users,
Monthly Activate Users
의 약자로
'일일 활성 유저', '주간 활성 유저', '월간 활성 유저'라는 의미를 가지고 있습니다.
DAU는 일자를 기준으로 해서 유저별 고유ID의 합계를 계산하면 되고,
WAU는 주 단위로 유저별 고유ID의 합계를 계산하면 되며,
MAU는 월 단위로 유저별 고유ID의 합계를 계산하면 구할 수 있습니다.
위 그래프를 보면 DAU와 MAU는 유사한 모양을 보이고 있는데
WAU만 왼쪽 꼬리를 잡아당긴 모양을 하고 있는 것을 확인할 수 있습니다.
이유는 DAU와 MAU의 경우 2016년도부터 2017년도 순서로 차트가 그려져있는데
WAU의 경우 1월부터 12월까지의 주차 순서대로 차트가 그려져있다보니
3, 4분기에 선이 솟아있는 것입니다.
* 금번 데이터의 경우 16년도 3, 4분기의 유저 방문이 많았음
'데이터 분석 공부 > 프로젝트' 카테고리의 다른 글
심화프로젝트 7일차(시간별/요일별 사용자수 히트맵)(24.02.12) (1) | 2024.02.12 |
---|---|
심화 프로젝트 6일차(방문 주차에따른 코호트 & 코호트별 weekly 리텐션 구하기)(24.02.11) (0) | 2024.02.11 |
심화 프로젝트 3일차(24.02.08) (0) | 2024.02.08 |
심화 프로젝트 2일차(24.02.07) (0) | 2024.02.08 |
기초 프로젝트 7일차(24.01.18) KPT(Keep Problem Try) (0) | 2024.01.18 |