일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- GA4
- 팀프로젝트
- cross join
- 군집화
- da
- 프로젝트
- 프롬프트 엔지니어링
- jd
- SQL
- 히트맵
- 서브쿼리
- 데이터 분석
- Python
- 기초통계
- 전처리
- lambda
- 클러스터링
- pandas
- 최종 프로젝트
- 시각화
- SQLD
- data analyst
- 크롤링
- 데이터분석
- streamlit
- 태블로
- 머신러닝
- Chat GPT
- 기초프로젝트
- If
- Today
- Total
목록전체 글 (328)
세조목
실전 프로젝트 2024.03.06 - [데이터 분석 공부/프로젝트] - 실전 프로젝트 7일차(24.03.06) 실전 프로젝트 7일차(24.03.06) 실전 프로젝트 7일차입니다. 금일은 팀원들과 함께 (고급)-1, 2, 그리고 (지옥) 난이도 문제를 풀었습니다. (고급)-1의 경우 구매 시각 이전에 event가 발생했는지 여부를 확인해야했습니다. 태블로 eyeoftheworld1209.tistory.com 실전 프로젝트 7일차였습니다. 굉장히 많은, 그리고 밀도있는 회의시간을 가진 하루였는데요, 관련해서는 위 포스팅에 정리해두었습니다.
실전 프로젝트 7일차입니다. 금일은 팀원들과 함께 (고급)-1, 2, 그리고 (지옥) 난이도 문제를 풀었습니다. (고급)-1의 경우 구매 시각 이전에 event가 발생했는지 여부를 확인해야했습니다. 태블로 내에서 해당 작업을 수행하는 것에 어려움을 느껴 파이썬에서 전처리를 진행했는데요, 1. event 테이블 df = pd.read_csv('N:/개인/데이터 분석/내배캠/4. 실전 프로젝트/events.csv') # product_id 추출 event = df[df['uri'].str.contains('product/')] event_2 = event.uri.str.split('/') event_2 = event_2.str.get(2) event['uri_num'] = event_2 event_df = ..
실전 프로젝트 2024.03.05 - [데이터 분석 공부/프로젝트] - 실전 프로젝트 6일차(24.03.05) 실전 프로젝트 6일차(24.03.05) 실전 프로젝트 6일차입니다. 금일은 (중급)-1 라인 차트 그리기 (고급)-1 파이 차트(or else) 그리기 (고급)-2 & (지옥) 개별적으로 풀어보기 를 진행했습니다. (중급)-1 의 경우 앞서 풀었던 (초급)-1~3 eyeoftheworld1209.tistory.com 금일은 실전 프로젝트 6일차였습니다. 기존에 풀었던 문제를 다시 보았는데 의문사항이 생겨 해당 의문을 해결하기위해 많은 시간을 할애하였습니다. 자세한 내용은 위 포스팅에 정리해두었습니다.
실전 프로젝트 6일차입니다. 금일은 (중급)-1 라인 차트 그리기 (고급)-1 파이 차트(or else) 그리기 (고급)-2 & (지옥) 개별적으로 풀어보기 를 진행했습니다. (중급)-1 의 경우 앞서 풀었던 (초급)-1~3 문제를 한 번에 표현하는 것으로 위와같이 시각화했습니다. (고급)-1의 경우 의문사항이 생겨 기존의 데이터를 가지고서 시각화를 진행할 수가 없었습니다. (고급)-1은 아래와 같은데요, 저희는 아래와 같이 각각의 테이블에서 user_id와 product_id(첫번째 fixed에서의 경우 split)를 기준으로 created_at의 최소값을 구해서 전자가 후자보다 작은지를 구해보았습니다. FIXED [User Id], [split] : MIN([Created At]) } < { FIXE..
실전 프로젝트 2024.03.04 - [데이터 분석 공부/프로젝트] - 실전 프로젝트 4~5일차(24.03.03~04) 실전 프로젝트 4~5일차(24.03.03~04) 연휴 기간동안 금번 프로젝트의 문제들을 풀어봤습니다. 2024.03.01 - [데이터 분석 공부/프로젝트] - 실전 프로젝트 2일차(24.03.01) 2024.03.02 - [데이터 분석 공부/프로젝트] - 실전 프로젝트 3일차(24.03. eyeoftheworld1209.tistory.com 금일은 팀원들과 함께 연휴 기간동안 각자 풀어보았던 프로젝트 문제들을 브리핑해보고 서로 어떻게 문제를 풀었는지, 원인은 무엇인지, 어떻게 해결할 수 있을 것인지 등에대해서 함께 얘기 나누었습니다. 자세한 내용은 위 포스팅에 정리해두었습니다.
연휴 기간동안 금번 프로젝트의 문제들을 풀어봤습니다. 2024.03.01 - [데이터 분석 공부/프로젝트] - 실전 프로젝트 2일차(24.03.01) 2024.03.02 - [데이터 분석 공부/프로젝트] - 실전 프로젝트 3일차(24.03.02) 3일차때까지 초급 난이도 문제들은 모두 풀어봤는데 중급 난이도 문제들을 풀지 못하여 어제는 중급 난이도 문제 풀이에 집중했고, 연휴 기간동안 팀원들 각자가 풀어본 문제들을 가지고서 금일은 브리핑을 진행했습니다. 우선 중급 난이도 문제들에는 가 있었는데 (중급)-1의 요구사항인 초급단계에서 구한 세 가지 값을 월별로 집계하여 Line Chart로 만드는 것이 쉽지 않았습니다. 저의 경우 이렇게 조건식을 만들어서 문제들을 풀었기 때문에 이 조건들을 모두 하나의 시트..
SQLD 서브쿼리 1. 다중 행 서브쿼리 EXISTS 서브쿼리로 어떤 데이터의 존재 여부를 확인하는 것 EXISTS의 결과는 참/거짓으로 반환됨 그룹함수 1. ROLLUP 각 컬럼의 중간 합계를 만들기 위해 사용하는 함수 컬럼의 개수가 N이면 ROLLUP 함수의 결과는 N+1개가 생성됨 계층 구조를 가지기때문에 인수의 순서가 바뀌게 되면 수행 결과도 바뀜 2. CUBE 결합 가능한 모든 값에 대해 집계를 생성함 컬럼의 순서가 바뀌어도 정렬되는 순서는 바뀌지만 데이터의 결과는 동일함 ROLLUP 함수에 비해서 시스템의 연산 대상이 많음 컬럼의 수가 N이라고 가정하면 2^N개의 중간 합계를 생성함 3. GROUPING ROLLUP이나 CUBE에 의해서 그룹화된 컬럼의 소계가 계산된 결과를 1로 표시하고, 그..
실전 프로젝트 2024.03.02 - [데이터 분석 공부/프로젝트] - 실전 프로젝트 3일차(24.03.02) 실전 프로젝트 3일차(24.03.02) 실전 프로젝트 3일차입니다. 금일은 어제 만들었던 시각화 자료들은 한 번 더 체크하고, 중급 난이도 문제를 풀어보았습니다. 두번째 중급 난이도 문제는 event가 발생하지 않은 유저/상품 쌍의 eyeoftheworld1209.tistory.com SQLD 24년도부터 SQLD 시험 출제 범위가 조금 바뀌었습니다. 빠진 부분도 있고 추가된 부분도 있는데 각각의 부분이 제가 기존에 듣고 있던 SQLD 강의의 몇 챕터에 해당하는지를 정리하고 학습을 진행했습니다. 추가적으로 문제풀이를위해 구매한 '이기적' 교재도 함께 보면서 문제 풀이도 중간 중간 진행했습니다. ..
실전 프로젝트 3일차입니다. 금일은 어제 만들었던 시각화 자료들은 한 번 더 체크하고, 중급 난이도 문제를 풀어보았습니다. 두번째 중급 난이도 문제는 event가 발생하지 않은 유저/상품 쌍의 존재여부를 merge하여 집계하고 그 비율을 파이 차트로 시각화하는 것입니다. LOD식을 작성했을때 EVENT가 없는 USER와 PRODUCT는 없는 것으로 확인이 됐습니다. 제가 계산을 잘못했을수도 있고, LOD식을 활용하는 것이 아닐수도 있습니다. 관련해서는 내일 다시 한 번 고민해보려고합니다.
2024.03.01 - [데이터 분석 공부/태블로] - 태블로 - 계산식(LOD식, IF조건문) 태블로 - 계산식(LOD식, IF조건문) 실전 프로젝트를 진행하면서 태블로로 시각화할 때 계산식을 꽤 많이 활용하고있다. '두 명 이상의 ~~~', '두 가지 이상의 ~~~', 'user_id가 없는 ~~~'와 같은 조건들 말이다. python에서야 groupby 메서드 eyeoftheworld1209.tistory.com 금일은 실전 프로젝트 2일차로 주어진 문제를 해결하기위해 고민하는 시간을 가졌습니다. 고민하는 과정에서 태블로에서 조건식을 작성하기위해서는 어떻게 해야하는지 학습할 수 있었습니다.