일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 데이터 분석
- 데이터분석
- da
- Chat GPT
- 프롬프트 엔지니어링
- 시각화
- 히트맵
- 크롤링
- jd
- SQL
- GA4
- 최종 프로젝트
- Python
- data analyst
- 팀프로젝트
- 클러스터링
- streamlit
- cross join
- SQLD
- 기초통계
- 서브쿼리
- 프로젝트
- lambda
- 기초프로젝트
- 군집화
- If
- 태블로
- pandas
- 머신러닝
- 전처리
- Today
- Total
세조목
기초 프로젝트 1일차(24.01.11) 본문
금일은 기초 프로젝트가 시작되는 날이었습니다.
미니 프로젝트의 경우 거의 지식없이 수행했던 프로젝트라
'이제 시작입니다.'라는 것을 알려주는 하나의 행사같은 느낌이었다면
이번 기초 프로젝트의 경우 캠프가 시작되고서 3주가 지난 뒤에 진행되는 프로젝트다보니
SQL, PYTHON, 데이터 리터러시, 알고리즘에 대한 지식이 어느정도는 쌓여있어서
미니 프로젝트보다는 틀이 잡힌 결과물이 나오지 않을까하는 생각이 들었습니다.
(미니 프로젝트 관련 영상은 아래 링크를 참고)
https://youtu.be/HVmAdD1d4bE?si=hVJUbRBMFVinRtfe
팀스파르타에서도 미니프로젝트때는 없던 조건(?)들을 두가지 제시했는데요,
조건은 다음과 같았습니다.
SQL을 메인으로 활용해야했으며 JOIN 기능을 활용해야하기때문에 N개의 데이터셋을 준비해야했습니다.
금일 오전 프로젝트 발제가 끝나고서 저희는 바로 팀 회의에 들어갔습니다.
금주 월, 화, 수 3일에 걸쳐서 하루에 1시간 정도씩 회의를 진행해왔던터라 얘기가 막힘은 없었습니다.
각자 조사해온 아이디어들을 공유했는데 그 중 아디다스 매출 데이터를 활용해보자는 방향으로 입이 모아졌습니다.
SQL에서 분석할 수 있는 CSV파일이었고 다른 데이터셋과의 연계가 가능할 것이라고 판단했기때문입니다.
저희가 생각한 기획안은 다음과 같습니다.
일자별 계획은 다음과 같습니다.
목(24.01.11) | 금(24.01.12) | 토(24.01.13) | 일(24.01.14) | 월(24.01.15) | 화(24.01.16) | 수(24.01.17) |
1. 문제 정의 2. 지표 설정 3. 목적 및 목표 설정 4. 가설수립 |
1. 가설수립 2. 팀 회의(가설 수립) * 각자의 의견 공유해서 가설 추리기 |
1. 가설 검증 | 1. 가설 검증 | 1. 가설 검증 2. 팀 회의(각자 검증해본 가설 공유하고 결과물 추리기 / 전략 도출) |
1. 발표자료 제작 | 1. 발표자료 제작 2. 발표 준비 및 발표 녹화 영상 제작 |
일단 저의 경우 오늘
- 아디다스 매출 데이터(XLSX파일)을 CSV파일로 바꾸고, SQL에서 작업할 수 있게끔 전처리 작업을 진행했습니다.
- 그런 다음 지표를 설정했는데 아디다스 매출 데이터 中 '판매량', '총 매출액', '영업이익', '주별 종류별 판로의 수' 이렇게 네가지를 지표로 설정했습니다.
- 가설검증을 위해서 위 네가지 지표에 영향을 미치는 요인들도 고민해봤는데 요인은 '인구수', '고용인구수', '빈곤율', '실업률', '중위 개인 소득', '뉴욕주 건강 상태', '보건행동(비만, 신체 활동 부족)' 이렇게 7가지로 정했습니다.
- '인구수', '고용인구수', '중위 개인 소득', '뉴욕주 건강 상태'는 지표들과 양의 상관관계를, '빈곤율', '실업률', '보건행동(비만, 신체 활동 부족)'은 음의 상관관계를 가질 것이라고 가설을 세웠습니다.
문제가 하나 있었는데 DBeaver에서 제가 직접 준비한 csv파일을 불러와 분석을 진행하는 것은 이번이 처음이다보니
DB를 연결하고, 쿼리 결과를 내보낼때 어려움이 있었습니다.
다행히 그리 오랜 시간이 걸리지 않고 해결방법을 찾아내었고 해당 내용은 아래 포스팅에 저장해두었습니다.
2024.01.11 - [데이터 분석 공부/SQL] - SQL 정리(MySql DBeaver DB 연결)(24.01.11)
2024.01.11 - [분류 전체보기] - SQL 정리(MySQL DBeaver 쿼리 결과 내보내기(결과 테이블 export))(24.01.11)
내일은 아직 다 확보하지 못한 요인 데이터들을 추가적으로 확보할 예정입니다.
'데이터 분석 공부 > 프로젝트' 카테고리의 다른 글
기초 프로젝트 6일차(24.01.17) (0) | 2024.01.17 |
---|---|
기초 프로젝트 5일차(24.01.16) (0) | 2024.01.16 |
기초 프로젝트 4일차(24.01.15) (0) | 2024.01.15 |
기초 프로젝트 3일차(24.01.14) (0) | 2024.01.14 |
기초 프로젝트 2일차(24.01.12) (0) | 2024.01.12 |