일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 시각화
- 군집화
- 히트맵
- 클러스터링
- 팀프로젝트
- 기초프로젝트
- SQL
- 최종 프로젝트
- lambda
- 머신러닝
- 크롤링
- Python
- jd
- If
- 태블로
- 프로젝트
- data analyst
- 데이터 분석
- 서브쿼리
- pandas
- da
- 기초통계
- 데이터분석
- 프롬프트 엔지니어링
- SQLD
- Chat GPT
- streamlit
- 전처리
- cross join
- GA4
Archives
- Today
- Total
세조목
기초 프로젝트 4일차(24.01.15) 본문
기초 프로젝트 4일차입니다.
금일은 주말간 개별적으로 수립하고 검증한 가설들을 공유하고,
흩어져있는 구슬들을 하나의 실로 꿰는 작업을 진행한 후
전략을 도출하는 단계까지 진행했습니다.
<현*(팀원 이름)>
- 비만율과 지표들간의 상관관계 확인하였으나 유의미한 관계 없는 것으로 확인됨
- '미국의 경우 빅사이즈 제품에 대한 수요가 많은데 아디다스가 이러한 니즈를 충족시키지 못한 것이 아닐까'라는 가설을 수립함
- 나이키 매출 데이터를 확인했을때 비만율과의 상관관계가 있는 것으로 확인된다면 아디다스 역시도 빅사이즈 제품의 공급을 늘리는 방향을 고려해볼 필요가 있음(나이키는 아디다스보다 더 큰 치수의 제품을 판매하고 있음).
- 나이키 매출 데이터 확인 예정
<서*>
- 'online 채널의 마진율이 높을 것이다'라는 가설에서 시작함
- 검증 결과 실제 online 채널의 매출액, 마진율 비중이 가장 높은 것으로 확인됨
- 제품 중에서는 woman's apparel의 마진율이 가장 높았음
<효*>
- '총인구수와 지표가 비례하지 않는 경우가 있는데 무엇이 원인일까?' 라는 질문에서 출발함
- 인구수는 많은데 매출액이 낮은 곳을 확인해본 결과 일리노이와 펜실베니아가 해당되었음
- 해당 지역에서의 15~43살 인구가 차지하는 비중은 대략 40% 수준이었음
- 만약 다른 주(state)에서의 15~43살 인구가 차지하는 비중이 상대적으로 높을 경우 연령대가 원인일 가능성이 있음(아디다스 주 소비 연령층이 누구인지와 함께 추가적으로 확인 예정)
<나>
2024.01.14 - [데이터 분석 공부/프로젝트] - 기초 프로젝트 3일차(24.01.14)
팀원들과 함께 공유한 내용들을 바탕으로 아래와 같은 방향성으로 발표 자료를 제작할 예정입니다.
EDA
각각의 페이지 內 설명과 관련된 이미지 첨부
DATASET 확인 결과 전체 51개의 STATE가 있었음
총 매출액, 판매량, 판로 등 총 4가지 지표를 선정하고, 해당 지표에 영향을 미치는 요인은 8가지 정도 선정하였음
* 8가지 요인 소개(고용인구, 건강행동, 중위소득, 비만율, 활동부족정도, 빈곤율, 실업률, 총인구)
* 8가지 요인을 나타낼 수 있는 심볼, 픽토그램 등 넣어두면 더욱 인지가 잘 될 것 같음
총인구, 고용인구, 중위개인소득은 양의 상관관계
나머지는 음의 상관관계를 가질 것이라고 가설을 수립했음
상관계수 확인 결과 총인구, 고용인구를 제외하고서는 유의미한 관계를 가지지 않는 것으로 확인됐음
* 상관계수 이미지 첨부
하여 두 요인의 주(STATE)별 성장률(10년 전과 비교)을 확인했음
* '총인구, 고용인구 성장률' 엑셀 파일 - '성장률' 시트 참고
총인구와 고용인구 모두에서 상위 10%에 들어가는 STATE는 ~~였고, 하위 10%에 들어가는 STATE는 ~~였음
* '총인구, 고용인구 성장률' 엑셀 파일 - '성장률' 시트 참고
해당 주들의 판로(SALES_METHOD)확인 결과 아래와 같은 특징을 가지고 있었음
* '총인구, 고용인구 성장률' 엑셀 파일 - '판로비중' 시트 참고
추가적으로 세가지 정도 더 가설을 수립하고 검증해보았다.
* 세 가지 가설에 대한 이미지 한 페이지에 소개
먼저 산업 전반에서 DT(Digital Transformation)의 움직임이 일어나고 있으므로
아디다스 역시도 online의 매출 비중 및 마진율이 가장 높을 것이라는 가설을 수립하였다.
실제 데이터 확인 결과 online의 매출 비중 및 마진율이 가장 높은 것을 확인할 수 있었다.
특히 n월에 woman's apparel의 마진율이 유독 높은 것을 확인할 수 있었다.
* 서인님 자료 보강 예정
다음으로 앞선 4가지 지표와 8가지 요인들간의 상관관계 확인 결과 비만율과 매출액 간에 특별한 상관관계가 없다는 것을
확인했다.
비만율과 활동 부족 정도가 높다고해서 제품을 덜 구매하는 것은 아니라는 의미인데
비만인을 위한 큰 사이즈 제품의 공급이 충분하지 않기때문일 것이라고 가설을 세웠다.
실제 데이터 확인 결과 큰 사이즈 제품의 종류가 다양했고, 금방 품절되는 것을 확인했다.
* 관련 이미지 첨부
(만약 나이키 데이터 있다면)나이키의 경우 아디다스보다 더 큰 사이즈 제품도 구비하고있는데
나이키의 매출액이 아디다스보다 높은 것에 이같은 요인도 영향을 미칠 것으로 판단된다.
앞선 4가지 지표와 8가지 요인들간의 상관관계 확인 결과 고용률 요인과 더불어 유일하게 유의미한 상관관계를 가지는
요인은 총인구 데이터였다.
그런데 총인구와 매출이 비례하지 않는 곳이 있었는데
일리노이와 펜실베이니아였다.
* 효정님 자료 보강 이후 업데이트
전략수립
상위 10% 주의 경우
idaho는 점포수, 매출액 모두 online의 비중이 가장 높았기때문에 특히 온라인 매출액 비중이 98%로 online에 보다 집중해야한다.
utah의 경우 점포 수는 3개 방식 모두 33%로 동일하지만 백화점, 슈퍼마켓 등에 입점하는 in-store형태의 매출액 비중이 95%로 가장 높기 때문에 in-store 형태로의 추가 입점 방안 수립해야한다.
nevada의 경우 outlet의 비중이 49%로 가장 높으나 매출액의 비중은 in-store의 비중이 55%로 가장 높다.
점포의 수는 가장 적지만 매출액의 비중이 55%를 차지하는 in-store 방식에 보다 집중하는 것이 좋을 것으로 판단된다.
florida의 경우도 nevada와 마찬가지로 in-store의 매출액 비중이 가장 높은데 이 주의 경우 in-store 매출 비중이 87%로 압도적인 비중을 보여주고 있다.
그렇기때문에 현재 40%를 차지하는 online과 26%를 차지하는 outlet의 비중을 줄이고 in-store 형태로의 입점에 집중할 필요가 있을 것이다.
하위10% 주의 경우
전체적으로 출점 비중을 낮출 것이긴 하나
louisiana의 경우 outlet과 in-store 매출액 비중이 각 2%, 14%로 online 매출에 훨씬 못미치기때문에 offline 점포의 수를 우선적으로 줄일 것이다.
west virginia와 alaska의 경우 반대로 in-sotre와 outlet 그러니까 offline 형태의 매출 비중이 높으므로 online 판로를 우선적으로 그 수를 조금씩 줄여나갈 것이다.
전반적으로 ONLINE의 매출 비중과 마진율이 확실히 높은 것을 확인할 수 있었기때문에
ONLINE의 비중이 높은 곳들은 계속해서 ONLINE에 집중할 예정이다.
OFFLINE(OUTLET, IN-STORE)의 경우도 점진적으로 ONLINE으로의 비중을 늘려나갈 것이다.
* WOMAN'S APPAREL 관련 전략은 보류
일부 내용들은 추가되거나, 제외될 것 같습니다.
'데이터 분석 공부 > 프로젝트' 카테고리의 다른 글
기초 프로젝트 6일차(24.01.17) (0) | 2024.01.17 |
---|---|
기초 프로젝트 5일차(24.01.16) (0) | 2024.01.16 |
기초 프로젝트 3일차(24.01.14) (0) | 2024.01.14 |
기초 프로젝트 2일차(24.01.12) (0) | 2024.01.12 |
기초 프로젝트 1일차(24.01.11) (1) | 2024.01.11 |