세조목

심화 프로젝트 4~5일차(DAU, WAU, MAU구하기)(24.02.09~10) 본문

데이터 분석 공부/프로젝트

심화 프로젝트 4~5일차(DAU, WAU, MAU구하기)(24.02.09~10)

세조목 2024. 2. 11. 21:58

DAU

# data type을 날짜로 변환
train_df2['date'] = train_df2['date'].apply(lambda x: pd.to_datetime(str(x), format = '%Y%m%d'))

# DAU 라인 차트로 표시
a = train_df2.groupby(['date'], as_index=False).agg({'fullVisitorId' : pd.Series.nunique})
sns.lineplot(data = a, x = 'date', y = 'fullVisitorId')

 

WAU

train_df2['date_week'] = train_df2['date'].dt.isocalendar().week
WAU = train_df2.groupby(['date_week'], as_index=False).agg({'fullVisitorId' : pd.Series.nunique})
sns.lineplot(data = WAU, x = 'date_week', y='fullVisitorId')

 

MAU

MAU = train_df2.resample('M',on='date')['fullVisitorId'].nunique()
MAU = MAU.to_frame()
sns.lineplot(data = MAU, x = 'date', y='fullVisitorId')

 


 

DAU, WAU, MAU는 각각

Daily Activate Users,

Weekly Activate Users,

Monthly Activate Users

의 약자로

'일일 활성 유저', '주간 활성 유저', '월간 활성 유저'라는 의미를 가지고 있습니다.

 

DAU는 일자를 기준으로 해서 유저별 고유ID의 합계를 계산하면 되고,

WAU는 주 단위로 유저별 고유ID의 합계를 계산하면 되며,

MAU는 월 단위로 유저별 고유ID의 합계를 계산하면 구할 수 있습니다.

 

위 그래프를 보면 DAU와 MAU는 유사한 모양을 보이고 있는데

WAU만 왼쪽 꼬리를 잡아당긴 모양을 하고 있는 것을 확인할 수 있습니다.

이유는 DAU와 MAU의 경우 2016년도부터 2017년도 순서로 차트가 그려져있는데

WAU의 경우 1월부터 12월까지의 주차 순서대로 차트가 그려져있다보니

3, 4분기에 선이 솟아있는 것입니다.

 * 금번 데이터의 경우 16년도 3, 4분기의 유저 방문이 많았음