세조목

기초 프로젝트 2일차(24.01.12) 본문

데이터 분석 공부/프로젝트

기초 프로젝트 2일차(24.01.12)

세조목 2024. 1. 12. 21:09

기초 프로젝트 2일차입니다.

금일은 팀 회의가 있는 날로

각자 아이다스 데이터셋을 둘러보고 나름대로의 가설을 세워서 같이 얘기 나눠보기로 했습니다.

 

저의 경우

  1. 매출액
  2. 영업이익
  3. 판매량
  4. 판로

이렇게 네가지를 지표로 삼았고

위 네가지 지표에 영향을 미치는 요인으로

  1. 고용인구
  2. 신체건강 불량 정도
  3. 중위 개인 소득
  4. 빈곤율
  5. 실업률
  6. 총인구
  7. 보건행동(비만, 신체 활동 부족)

7가지를 정했습니다.

 

위 데이터들을 바탕으로 저는

총인구, 고용인구, 중위 개인 소득는 양의 상관관계를 가질 것이고,

빈곤율, 실업률, 보건행동(비만, 신체 활동 부족), 신체건강 불량 정도는 음의 상관관계를 가질 것이라는

가설을 수립했습니다.

 

가설 수립 후 시간이 남아서 가설을 검증까지 한번 해봤습니다.

 

아디다스 매출 데이터 csv파일을 SQL로 가져와서

 

테이블끼리 join을 하고 필요한 데이터들만 추린 후 다시 export했습니다.

 

 

그렇게 추출한 csv파일을 다시 python으로 불러와서 상관관계를 살펴봤습니다.

 

 

오후 7시에 팀원들과 함께 각자 수립한 가설을 공유해봤는데요,

확실히 여러명이서 얘기를 나누니 다양한 생각들이 나왔습니다.

새롭게 추가되고 또 검증해야할 가설들이 있었기때문에 각자 분석할 가설들을 나눠서

다음주 월요일 회의 전까지 준비해오도록 했습

<To Do>

가설 수립 배경 설명

★ 7가지 요인
 - 고용
 - 겅강상태(=신체건강불량정도)
 - 중위소득
 - 빈곤율
 - 실업률
 - 총인구
 - 보건행동(비만, 신체 활동 부족)
 → 정희

★ 월별, 매출액(or 영업이익, 판매량, 판로...)과의 관계 확인
    어떠한 규칙성 보일 경우 가설 수립 및 검증
 → 서*(팀원이름)

 가설: 월마다 스포츠 경기 시즌일수도 있으니까 운동용 신발 많이 팔릴수 있지 않을까?

★ 인구와 매출(or 영업이익, 판매량...)이 비례하지 않는 곳이 있는데 왜 그럴까?
 → 효*(팀원이름)

★ 비만이신분들이 착용할 수 있는 제품이 부족하기때문에
비만율과 매출액은 음의 상관관계를 가질 것이다.
 - (먼저)실제 미국에서 판매되고 있는 빅사이즈 제품의 치수 확인
 - 현*(팀원이름)

----------------------------------------------------------

<보류>
★ 실업률과 총매출액 양의 상관관계(0.3)
퇴직금을 받고 구매할 수도 있다.
재취업까지의 시기가 짧다.
 → 튜터님께 질문

★ 빈곤율도 양의 상관관계가 나오는데
 → 튜터님께 질문

 

다음주 월요일 최종 가설 검증 및 전략 도출까지 완료 후(전략 도출은 화요일 오전까지 길어질 수 있음)

화요일부터는 발표 자료 제작에 들어갈 예정입니다.