일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- If
- SQLD
- 전처리
- streamlit
- 기초프로젝트
- 데이터분석
- 클러스터링
- data analyst
- 데이터 분석
- SQL
- 크롤링
- 군집화
- cross join
- 프로젝트
- 머신러닝
- 기초통계
- 시각화
- 히트맵
- Python
- 태블로
- 프롬프트 엔지니어링
- jd
- 서브쿼리
- pandas
- lambda
- GA4
- 팀프로젝트
- Chat GPT
- da
- 최종 프로젝트
- Today
- Total
목록데이터 분석 공부 (325)
세조목
SQLD 서브쿼리 1. 다중 행 서브쿼리 EXISTS 서브쿼리로 어떤 데이터의 존재 여부를 확인하는 것 EXISTS의 결과는 참/거짓으로 반환됨 그룹함수 1. ROLLUP 각 컬럼의 중간 합계를 만들기 위해 사용하는 함수 컬럼의 개수가 N이면 ROLLUP 함수의 결과는 N+1개가 생성됨 계층 구조를 가지기때문에 인수의 순서가 바뀌게 되면 수행 결과도 바뀜 2. CUBE 결합 가능한 모든 값에 대해 집계를 생성함 컬럼의 순서가 바뀌어도 정렬되는 순서는 바뀌지만 데이터의 결과는 동일함 ROLLUP 함수에 비해서 시스템의 연산 대상이 많음 컬럼의 수가 N이라고 가정하면 2^N개의 중간 합계를 생성함 3. GROUPING ROLLUP이나 CUBE에 의해서 그룹화된 컬럼의 소계가 계산된 결과를 1로 표시하고, 그..
실전 프로젝트 2024.03.02 - [데이터 분석 공부/프로젝트] - 실전 프로젝트 3일차(24.03.02) 실전 프로젝트 3일차(24.03.02) 실전 프로젝트 3일차입니다. 금일은 어제 만들었던 시각화 자료들은 한 번 더 체크하고, 중급 난이도 문제를 풀어보았습니다. 두번째 중급 난이도 문제는 event가 발생하지 않은 유저/상품 쌍의 eyeoftheworld1209.tistory.com SQLD 24년도부터 SQLD 시험 출제 범위가 조금 바뀌었습니다. 빠진 부분도 있고 추가된 부분도 있는데 각각의 부분이 제가 기존에 듣고 있던 SQLD 강의의 몇 챕터에 해당하는지를 정리하고 학습을 진행했습니다. 추가적으로 문제풀이를위해 구매한 '이기적' 교재도 함께 보면서 문제 풀이도 중간 중간 진행했습니다. ..
실전 프로젝트 3일차입니다. 금일은 어제 만들었던 시각화 자료들은 한 번 더 체크하고, 중급 난이도 문제를 풀어보았습니다. 두번째 중급 난이도 문제는 event가 발생하지 않은 유저/상품 쌍의 존재여부를 merge하여 집계하고 그 비율을 파이 차트로 시각화하는 것입니다. LOD식을 작성했을때 EVENT가 없는 USER와 PRODUCT는 없는 것으로 확인이 됐습니다. 제가 계산을 잘못했을수도 있고, LOD식을 활용하는 것이 아닐수도 있습니다. 관련해서는 내일 다시 한 번 고민해보려고합니다.
2024.03.01 - [데이터 분석 공부/태블로] - 태블로 - 계산식(LOD식, IF조건문) 태블로 - 계산식(LOD식, IF조건문) 실전 프로젝트를 진행하면서 태블로로 시각화할 때 계산식을 꽤 많이 활용하고있다. '두 명 이상의 ~~~', '두 가지 이상의 ~~~', 'user_id가 없는 ~~~'와 같은 조건들 말이다. python에서야 groupby 메서드 eyeoftheworld1209.tistory.com 금일은 실전 프로젝트 2일차로 주어진 문제를 해결하기위해 고민하는 시간을 가졌습니다. 고민하는 과정에서 태블로에서 조건식을 작성하기위해서는 어떻게 해야하는지 학습할 수 있었습니다.