세조목

기초 프로젝트 1일차(24.01.11) 본문

데이터 분석 공부/프로젝트

기초 프로젝트 1일차(24.01.11)

세조목 2024. 1. 11. 21:41

금일은 기초 프로젝트가 시작되는 날이었습니다.

미니 프로젝트의 경우 거의 지식없이 수행했던 프로젝트라

'이제 시작입니다.'라는 것을 알려주는 하나의 행사같은 느낌이었다면

이번 기초 프로젝트의 경우 캠프가 시작되고서 3주가 지난 뒤에 진행되는 프로젝트다보니

SQL, PYTHON, 데이터 리터러시, 알고리즘에 대한 지식이 어느정도는 쌓여있어서

미니 프로젝트보다는 틀이 잡힌 결과물이 나오지 않을까하는 생각이 들었습니다.

(미니 프로젝트 관련 영상은 아래 링크를 참고)

https://youtu.be/HVmAdD1d4bE?si=hVJUbRBMFVinRtfe

 

팀스파르타에서도 미니프로젝트때는 없던 조건(?)들을 두가지 제시했는데요,

조건은 다음과 같았습니다.

 

SQL을 메인으로 활용해야했으며 JOIN 기능을 활용해야하기때문에 N개의 데이터셋을 준비해야했습니다.

금일 오전 프로젝트 발제가 끝나고서 저희는 바로 팀 회의에 들어갔습니다.

금주 월, 화, 수 3일에 걸쳐서 하루에 1시간 정도씩 회의를 진행해왔던터라 얘기가 막힘은 없었습니다.

각자 조사해온 아이디어들을 공유했는데 그 중 아디다스 매출 데이터를 활용해보자는 방향으로 입이 모아졌습니다.

SQL에서 분석할 수 있는 CSV파일이었고 다른 데이터셋과의 연계가 가능할 것이라고 판단했기때문입니다.

저희가 생각한 기획안은 다음과 같습니다.

 

일자별 계획은 다음과 같습니다.

목(24.01.11) 금(24.01.12) 토(24.01.13) 일(24.01.14) 월(24.01.15) 화(24.01.16) 수(24.01.17)
1. 문제 정의
2. 지표 설정
3. 목적 및 목표 설정
4. 가설수립
1. 가설수립
2. 팀 회의(가설 수립)
 * 각자의 의견 공유해서 가설 추리기
1. 가설 검증 1. 가설 검증 1. 가설 검증
2. 팀 회의(각자 검증해본 가설 공유하고 결과물 추리기 / 전략 도출)
1. 발표자료 제작 1. 발표자료 제작
2. 발표 준비 및 발표 녹화 영상 제작 

 

일단 저의 경우 오늘

  1. 아디다스 매출 데이터(XLSX파일)을 CSV파일로 바꾸고, SQL에서 작업할 수 있게끔 전처리 작업을 진행했습니다.
  2. 그런 다음 지표를 설정했는데 아디다스 매출 데이터 中 '판매량', '총 매출액', '영업이익', '주별 종류별 판로의 수' 이렇게 네가지를 지표로 설정했습니다.
  3. 가설검증을 위해서 위 네가지 지표에 영향을 미치는 요인들도 고민해봤는데 요인은 '인구수', '고용인구수', '빈곤율', '실업률', '중위 개인 소득', '뉴욕주 건강 상태', '보건행동(비만, 신체 활동 부족)' 이렇게 7가지로 정했습니다.
  4. '인구수', '고용인구수', '중위 개인 소득', '뉴욕주 건강 상태'는 지표들과 양의 상관관계를, '빈곤율', '실업률', '보건행동(비만, 신체 활동 부족)'은 음의 상관관계를 가질 것이라고 가설을 세웠습니다.

문제가 하나 있었는데 DBeaver에서 제가 직접 준비한 csv파일을 불러와 분석을 진행하는 것은 이번이 처음이다보니

DB를 연결하고, 쿼리 결과를 내보낼때 어려움이 있었습니다.

다행히 그리 오랜 시간이 걸리지 않고 해결방법을 찾아내었고 해당 내용은 아래 포스팅에 저장해두었습니다. 

 

2024.01.11 - [데이터 분석 공부/SQL] - SQL 정리(MySql DBeaver DB 연결)(24.01.11)

 

SQL 정리(MySql DBeaver DB 연결)(24.01.11)

DBeaver를 사용해서 MySql에 연결하고있다. 기본 프로젝트를 진행하며 csv파일을 불러오려고하는데 아래와 같은 오류 메시지가 떴다. SQL Error [1046] [3D000]: No database selected 이 오류 메시지는 적혀있는

eyeoftheworld1209.tistory.com

2024.01.11 - [분류 전체보기] - SQL 정리(MySQL DBeaver 쿼리 결과 내보내기(결과 테이블 export))(24.01.11)

 

SQL 정리(MySQL DBeaver 쿼리 결과 내보내기(결과 테이블 export))(24.01.11)

원하는 값을 출력하기위해 쿼리문을 작성하고서 결과값을 export해야할 때가 있다. 내가 알고있는 방법은 두가지인데 첫번째 방법 1. 결과테이블을 우클릭하면 '데이터 추출'이 보인다. 2. '데이터

eyeoftheworld1209.tistory.com

 

내일은 아직 다 확보하지 못한 요인 데이터들을 추가적으로 확보할 예정입니다.